17、(本小题满分 12 分)
某高校共有 15000 人,其中男生 10500 人,女生 4500 人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300 位学生每周平均体育运动时间的样本数据(单位:小时)
(I)应收集多少位女生样本数据?
(II)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:$[0,2],(2,4],(4,6],(6,8],(8,10],(10,12]$.估计该校学生每周平均体育运动时间超过 4 个小时的概率。

(III)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4 个小时。请完成每周平均体育运动时间与性别的列联表,并判断是否有 $95 \%$ 的把握认为"该校学生的每周平均体育运动时间与性别有关"。附:
$K^{2}=\frac{n(a d-b c)^{2}}{(a+b)(c+d)(a+c)(b+d)}$
| $P\left(K^{2} \geq k_{0}\right)$ | 0.10 | 0.05 | 0.010 | 0.005 |
| :--- | :--- | :--- | :--- | :--- |
| $k_{0}$ | 2.706 | 3.841 | 6.635 | 7.879 |
参考答案(1) 90; (2) 0.75; (3) 有 $95 \%$ 的把握认为"该校学生的每周平均体育运动时间与性别有关".【解析】 试题分析:①利用分层抽样的应用可以简出 $300 \times \frac{4500}{15000}=90$,记应收集 90 位女生的样本数据。② 根据频率分布直方图可得 $1-2 \times(0.100+0.025)=0.75$.③根据题意 300 位学生中有 $300 \times 0.75=225$人