1、第七章测评(时间:120分钟满分:150分)一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是()A.均值与方差B.排列与组合C.概率D.独立性检验答案D2.(2020四川绵阳高三上月考)已知变量X,Y之间的线性回归方程Y=-0.7X+10.3,且变量X,Y之间的一组相关数据如表所示,则下列说法错误的是()X681012Y6m32A.变量X,Y之间呈负相关关系B.m=4C.可
2、以预测,当X=20时,Y=-3.7D.该回归直线必过点(9,4)答案B解析A中,由线性回归方程Y=-0.7X+10.3知b=-0.76.635,所以有99%的把握认为它们之间有关联.4.用最小二乘法得到一组数据(xi,yi)(i=1,2,3,4,5)的线性回归方程为Y=2X+3,若i=15xi=25,则i=15yi等于()A.11B.13C.53D.65答案D解析i=15xi=25,x=5.代入Y=2X+3,可得y=13,i=15yi=65.5.(2021江苏无锡一模)某词汇研究机构为对某城市人们使用流行用语的情况进行调查,随机抽取了200人进行调查统计得到下方的22列联表.则根据列联表可知(
3、)流行用语情况年轻人非年轻人总计经常用流行用语12525150不经常用流行用语351550总计16040200参考公式:独立性检验统计量2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.A.有95%的把握认为“经常用流行用语”与“年轻人”有关系B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系C.有97.5%的把握认为“经常用流行用语”与“年轻人”有关系D.有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系答案A解析2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200(12515-2535)216040501504.1
4、673.841.所以有95%的把握认为“经常用流行用语”与“年轻人”有关系.6.(2020陕西咸阳期末)两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的相关系数r如表,其中拟合效果最好的模型是()模型模型1模型2模型3模型4相关系数r0.480.150.960.30A.模型1B.模型2C.模型3D.模型4答案C解析在线性回归分析中,相关系数为r,|r|越接近于1,其相关程度越大;|r|越接近于0,相关程度越小;由模型3的相关系数|r|最接近于1,知其模拟效果最好.7.某机构调查市民收入增减与购买愿望的关系时,采用独立性检验法抽查了6 000人,计算发现2=7.831,则根据这一数据
5、查阅下表,该机构断言市民收入增减与购买愿望有关系的可信程度是()A.90%B.95%C.99%D.99.5%答案C解析2=7.8316.635,可断言市民收入增减与购买愿望有关系的可信程度为99%,故选C.8.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:是否发病未发病发病总计未注射疫苗20注射疫苗30总计5050100现从试验动物中任取一只,取得“注射疫苗”的概率为25,则下列判断错误的是()公式:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),
6、n=a+b+c+d.A.注射疫苗发病的动物数为10B.从该试验未注射疫苗的动物中任取一只,发病的概率为23C.有99%的把握判断注射疫苗与是否发病有关联D.有95%的把握判断注射疫苗与是否发病有关联答案D解析由题知,从试验动物中任取一只,取得“注射疫苗”的概率为25,可补充列联表,是否发病未发病发病总计未注射疫苗204060注射疫苗301040总计5050100故注射疫苗的动物共40只,未注射的为60只,A,B正确.2=100(2010-4030)260405050=16.676.635,故C正确,D错误.故选D.二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合
7、题目要求.全部选对的得5分,有选错的得0分,部分选对的得3分.9.(2021山东烟台模拟)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,结果如表所示:性别晕机不晕机合计男a15a+15女6dd+6合计a+62846则下列说法正确的是()A.aa+156d+6B.2619,所以选项A正确;由题可知2=46(1213-156)2271918280.7756.635,在犯错误概率不超过0.01的前提下认为“喜欢乡村音乐与性别有关”,即有99%以上的把握认为“喜欢乡村音乐与性别有关”.12.用旧设备和改造后的新设备冶炼某种金属,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表
8、:设备类别杂质高杂质低旧设备37121新设备22202根据以上数据,则下列说法错误的是()A.有99%的把握判断含杂质的高低与设备改造有关B.含杂质的高低与设备改造无关C.新设备生产的产品中所含杂质比旧设备低D.有99%的把握判断杂质的高低与设备改造无关答案BCD解析由已知数据得到如下22列联表:设备类别杂质高杂质低总计旧设备37121158新设备22202224总计59323382由公式得2=382(37202-12122)21582245932313.11.由于13.116.635,则有99%的把握判断含杂质的高低与设备改造有关.故选BCD.三、填空题:本题共4小题,每小题5分,共20分.
9、13.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了检验主修统计专业是否与性别有关系,根据表中的数据,得到2=50(1320-107)2232720304.844.因为23.841,所以断定主修统计专业与性别有关系.这种判断的把握为.答案95%解析根据2=4.8443.841,因此有95%的把握判断主修统计专业与性别有关系.14.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,阴性家族史者糖尿病发病的有17例,不发病的有240例,那么,有的把握判断糖尿病患者与遗传有关系.答案9
10、5%解析列出22列联表:家族患病情况发病不发病总计阳性家族史1693109阴性家族史17240257总计333333662=366(16240-1793)2109257333336.0673.841,因此,有95%的把握判断糖尿病患者与遗传有关.15.某科研机构为了了解某种在研制的药品的指标数据Y与百分比浓度P之间的关系,随机统计了某5次实验的相关数据,并制作了对照表如下:百分比浓度P610141822指标数据Y62m442814由表中数据求得线性回归方程为Y=-3P+82.2,则m=.答案53解析由题意p=22+18+14+10+65=14,y=14+28+44+m+625=148+m5,所
11、以148+m5=-314+82.2,解得m=53.16.(2020辽宁沈阳三模)某高校有10 000名学生,其中女生3 000名,男生7 000名.为调查爱好体育运动是否与性别有关,用分层抽样的方法抽取120名学生,制成独立性检验的22列联表如下,则a-b=.(用数字作答)性别男女总计爱好体育运动a9#不爱好体育运动28b#总计#120答案29解析根据分层抽样原理,计算抽取男生1207 00010 000=84(人),女生1203 00010 000=36(人),所以a=84-28=56(人),b=36-9=27(人),所以a-b=56-27=29(人).四、解答题:本题共6小题,共70分.解
12、答应写出文字说明、证明过程或演算步骤.17.(10分)(2021安徽宿州检测)某村海拔1 500米,交通极为不便,被称为“云端上的村庄”,系建档立卡贫困村.该省政府办公厅组建了精准扶贫组进行定点帮扶,扶贫组在实地调研和充分听取群众意见后,立足当地独特优势,大力发展高山蔬菜和生态黑猪,有效带动了全村父老乡亲脱贫奔小康.村民甲在企业帮扶下签订合同,代养生态黑猪,2016年至2020年养殖黑猪的年收入Y(单位:万元)的数据如表:年份20162017201820192020年份代号X12345年收入Y5.66.57.48.29.1(1)请根据表中的数据,用最小二乘法求出Y关于X的线性回归方程;(2)利
13、用(1)中的线性回归方程,预测2021年该村民养殖黑猪的年收入.附:回归直线的斜率和截距的最小二乘估计公式分别为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-b x.解(1)x=15(1+2+3+4+5)=3,y=15(5.6+6.5+7.4+8.2+9.1)=7.36,i=15(xi-x)2=4+1+0+1+4=10,i=15(xi-x)(yi-y)=8.7,b=i=15(xi-x)(yi-y)i=15(xi-x)2=8.710=0.87,a=y-b x=7.36-0.873=4.75,Y关于X的线性回归方程为Y=0.87X+4.75;(2)将2021年的年份代号X=6
14、代入Y=0.87X+4.75,可得Y=0.876+4.75=9.97(万元).故预测2021年该村民养殖黑猪的年收入为9.97万元.18.(12分)(2021四川广元模拟)某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.(1)请补充完整22列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?性别效果一般效果较好总计男20女1555总计(2)根据(1)中列联表的数据,在评分为“效果较好”的学生中按照性别用分层抽样的方法抽取了6名学生.若从这6名
15、学生中随机选择2名进行访谈,求所抽取的2名学生中恰好有1名男生的概率.2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.解(1)根据题意填写列联表如下:性别效果一般效果较好总计男252045女154055总计4060100计算2=100(2540-1520)2455540608.2496.635,所以有99%的把握认为线上教学效果评分为“效果较好”与性别有关.(2)根据列联表中的数据,用分层抽样法抽取6名学生,其中男生2人,女生4人,故所求的概率为C21C41C62=815.19.(12分)(2021江苏连云港质检)机动车行经人行横道时,应当减速慢行;遇行人正
16、在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干路口监控设备所抓拍的1月份到5月份这5个月内驾驶员不“礼让行人”行为统计数据:月份12345违章驾驶员人数1201051009580(1)请利用所给数据求违章人数Y与月份X之间的线性回归方程Y=bX+a;(2)预测该路口9月份的不“礼让行人”违章驾驶员人数;(3)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:驾龄不礼让行人礼让行人驾龄不超过1年2416驾龄1年以上1614能否据此判断有90%的把握认为“礼让行人”行为与驾龄有关?参考公式:b=i=1nxiyi-nx yi=1
17、nxi2-nx2=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-b x,2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d).解(1)由表中的数据可知,x=15(1+2+3+4+5)=3,y=15(120+105+100+95+80)=100,所以b=i=1nxiyi-nxyi=1nxi2-nx2=1 410-1 50055-45=-9,所以a=y-b x=127,故所求线性回归方程为Y=-9X+127;(2)由(1)可知,Y=-9X+127,令X=9,则Y=-99+127=46(人);(3)由表中数据可得2=70(2414-1616)24
18、03040300.3116.635.因此,能有99%的把握认为亚健康与性别有关.21.(12分)(2020福建福州检测)某沙漠地区经过治理,生态系统得到改善.为调查该地区植物覆盖面积(单位:公顷)和某种野生动物的数量的关系,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1 200,i=120(xi-x)2=80,i=120(yi-y)2=9 000,i=120(xi-x)(yi-y)=80
19、0.(1)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01),并用相关系数说明各样区的这种野生动物的数量与植物覆盖面积的相关性.(2)根据现有统计资料得知,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2.解(1)样本(xi,yi)(i=1,2,20)的相关系数为r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2=800809 000=2230.94,由于0.94接近1
20、,说明各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性.(2)更合理的抽样方法是分层抽样.理由如下:由(1)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异也很大,采用分层抽样的方法能较好地保持样本结构与总体结构的一致性,提高样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.22.(12分)(2020重庆开县月考)2020年11月11日当天各大线上网站的消费额统计都创下新高,某网站为了调查线上购物时“高消费用户”是否与性别有一定关系,随机调查200个11月11日当天在该网站消费的用户,得到了如下
21、不完整的列联表;定义11月11日当天消费不高于10 000元的用户为“非高消费用户”,消费10 000元以上的用户为“高消费用户”.性别高消费用户非高消费用户总计男20女40总计80附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).n=a+b+c+d.(1)将列联表填写完整,并判断是否有99%的把握认为线上购物时“高消费用户”与性别有关.(2)若按高消费与非高消费分层,采用分层抽样的方法从随机调查的200个用户中抽出10个人,再随机抽4人,求4人中恰有2人是高消费用户的概率.解(1)根据题意填写列联表如下:性别高消费用户非高消费用户总计男2080100女6040100总计80120200由列联表中数据,得2=200(2040-6080)28012010010033.3336.635,所以有99%的把握认为线上购物时“高消费用户”与性别有关.(2)采用分层抽样的方法从随机调查的200个用户中抽出10个人,其中4人是高消费用户,6人是非高消费用户,所求概率为C42C62C104=37.12