1、北京曲一线图书策划有限公司 2024版5年高考3年模拟A版11.5变量间的相关关系、统计案例基础篇考点一变量间的相关关系1.(2023届广东东莞四中月考,5)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.r2r40r3r1B.r2r40r1r3C.r4r20r3r1D.r4r20r16.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.2.(2022全国甲文,17,12分)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020
2、B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.1000.0500.010k2.7063.8416.635解析(1)由题意可得A公司长途客车准点的概率P1=240260=1213,B公司长途客车准点的概率P2=210240=78.(2)因为K2=500(2403020210)2450502402603.2052.706,所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.3.(
3、2020新高考,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表:SO2PM2.50,50(50,150(150,4750,3532184(35,756812(75,1153710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的22列联表:SO2PM2.50,150(150,4750,75(75,115(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.附:K2=n(ad
4、bc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.0500.0100.001k3.8416.63510.828.解析(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)根据抽查数据,可得22列联表:SO2PM2.50,150(150,4750,756416(75,1151010(3)根据(2)的列联表得K2=100(64101610)2802074267.484.由于7.4846.635,故有9
5、9%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.4.(2023届长沙一中月考二,20)某芯片制造企业使用新技术对某款芯片进行试生产.在试产初期,该款芯片生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.(1)在试产初期,该款芯片的批次M生产前三道工序的次品率分别为P1=160,P2=159,P3=158.求批次M芯片的次品率PM;第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行抽查检验.已知批次M的芯片智能自动检测显示合格率为98%,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率.(2)该企业改
6、进生产工艺后生产了批次N的芯片.某手机生产厂商获得批次M与批次N的芯片,并在某款新型手机上使用.现对使用这款手机的用户回访,对开机速度进行满意度调查.据统计,回访的100名用户中,安装批次M的有40人,其中对开机速度满意的有30人;安装批次N的有60人,其中对开机速度满意的有58人.依据=0.005的独立性检验,能否认为芯片批次与用户对开机速度满意度有关?附:2=n(adbc)2(a+b)(c+d)(a+c)(b+d)0.100.050.0100.0050.001x2.7063.8416.6357.87910.828解析(1)批次M芯片的次品率为PM=1-(1-P1)(1-P2)(1-P3)=
7、1-596058595758=120.设批次M的芯片智能自动检测合格为事件A,人工抽检合格为事件B,由已知得P(A)=98100,P(AB)=1-PM=1-120=1920,则工人在流水线进行人工抽检时,抽检一个芯片恰为合格品为事件B|A,P(B|A)=P(AB)P(A)=192010098=9598.(2)零假设为H0:芯片批次与用户对开机速度满意度无关.由数据可建立22列联表如下:(单位:人)开机速度满意度芯片批次合计MN不满意10212满意305888合计4060100根据列联表得2=n(adbc)2(a+b)(c+d)(a+c)(b+d)=100(1058230)24060128810
8、.677.879.因此,依据=0.005的独立性检验,我们推断H0不成立,即能认为芯片批次与用户对开机速度满意度有关.此推断犯错误的概率不大于0.005.5.(2020课标,18,12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的
9、空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.人次400人次400空气质量好空气质量不好附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.0500.0100.001k3.8416.63510.828.解析(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计
10、值为1100(10020+30035+50045)=350.(3)根据所给数据,可得22列联表:人次400人次400空气质量好3337空气质量不好228根据列联表得K2=100(3382237)2554570305.820.由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.6.(2023届河北邯郸摸底,19)暑假期间,某学校建议学生保持晨读的习惯,开学后,该校对高二、高三随机抽取200名学生(该学校学生总数较多),调查日均晨读时间,数据如表:日均晨读时间/分钟0,10)10,20)20,30)30,40)40,50)50,60人数510255050
11、60将学生日均晨读时间在30,60上的学生评价为“晨读合格”.(1) 请根据上述表格中的统计数据填写下面22列联表,依据=0.05的独立性检验,能否认为“晨读合格”与年级有关?晨读不合格晨读合格合计高二高三15100合计(2)将上述调查所得到的频率视为概率来估计全校的情况,现在从该校所有学生中,随机抽取2名学生,记所抽取的2人中晨读合格的人数为随机变量,求的分布列和数学期望.参考公式:2=n(adbc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.临界值表:0.10.050.010.0050.001x2.7063.8416.6357.87910.828解析(1)列联表如下
12、:晨读不合格晨读合格合计高二2575100高三1585100合计401602002=200(25851575)210010040160=3.12530.1,故可以预测小强第9次的慢跑时间会超过小明这100天慢跑的平均时间.4.(2023届浙江嘉兴一中期中,20)根据中国海洋生态环境状况公报,从2017年到2021年全国直排海污染源中各年份的氨氮总量y(单位:千吨)与年份的散点图如图.记年份代码为x(x=1,2,3,4,5),t=1x,对数据处理后得:yti=15ti2i=15yi2i=15xiyii=15tiyi60.51.52107617(1)根据散点图判断,模型y=bx+a与模型y=dx+
13、c哪一个适宜作为y关于x的回归方程?(给出判断即可,不必说明理由)(2)根据(1)的判断结果,建立y关于x的回归方程,并预测2022年全国直排海污染源中的氨氮总量(计算结果精确到整数).参考公式:回归方程y=vx+u中斜率和截距的最小二乘估计公式分别为v=i=1n(xix)(yiy)i=1n(xix)2=i=1nxiyinxyi=1nxi2nx2,u=yvx.解析(1)根据散点图的趋势,可知模型适宜作为y关于x的回归方程.(2)因为d=i=15tiyi5tyi=15ti25t2=8,且c=ydt=2,所以y关于t的回归方程为y=8t+2,即y关于x的回归方程为y=8x+2,2022年对应的年份
14、代码为x=6,所以y3,故预计2022年全国直排海污染源中的氨氮总量为3千吨.5.(2023届广州仲元中学月考,20)随着时代的不断发展,社会对高素质人才的需求不断扩大,我国本科毕业生中考研人数也不断攀升,2020年的考研人数是341万人,2021年的考研人数是377万人.某省统计了该省其中四所大学2022年的毕业生人数及考研人数(单位:千人),得到如下表格:大学A大学B大学C大学D大学2022年毕业生人数x(千人)76542022年考研人数y(千人)0.50.40.30.2(1)已知y与x具有较强的线性相关关系,求y关于x的经验回归方程y=bx+a;(2)假设该省对选择考研的大学生每人发放0
15、.5万元的补贴.若该省E大学2022年毕业生人数为8千人,估计该省要发放补贴的总金额;若A大学的毕业生中小浙、小江选择考研的概率分别为p,3p-1,该省对小浙、小江两人的考研补贴总金额的期望不超过0.75万元,求p的取值范围.参考公式:b=i=1n(xix)(yiy)i=1n(xix)2=i=1nxiyinxyi=1nxi2nx2,a=ybx.解析(1)由题意得x=4+5+6+74=5.5,y=0.2+0.3+0.4+0.54=0.35,又i=14xiyi=70.5+60.4+50.3+40.2=8.2,i=14xiyi4xy=8.2-45.50.35=0.5,i=14xi2=72+62+52
16、+42=126,i=14xi24x2=126-45.52=5,b=i=14xiyi4xyi=14xi24x2=0.55=0.1,a=ybx=0.35-0.15.5=-0.2,故y关于x的经验回归方程为y=0.1x-0.2.(2)将x=8代入y=0.1x-0.2,得y=0.18-0.2=0.6,估计该省要发放补贴的总金额为0.61 0000.5=300(万元).设小浙、小江两人中选择考研的人数为X,则X的所有可能值为0,1,2.P(X=0)=(1-p)(2-3p)=3p2-5p+2,P(X=1)=(1-p)(3p-1)+p(2-3p)=-6p2+6p-1,P(X=2)=p(3p-1)=3p2-p
17、,E(X)=0(3p2-5p+2)+(-6p2+6p-1)1+(3p2-p)2=4p-1,E(0.5X)=0.5(4p-1)0.75,解得p58,又03p-11,13p23,13p58,故p的取值范围为13,58.考法二独立性检验的应用1.(2023届重庆质量检测,18)某大型企业组织全体员工参加体检,为了解员工的健康状况,企业相关工作人员从中随机抽取了40人的体检报告进行相关指标的分析,按体重“超标”和“不超标”制成22列联表如下:超标不超标合计男1620女15合计附:2=n(adbc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.0.10.050.010.0050.001
18、x2.7063.8416.6357.87910.828(1)完成题中的22列联表,并根据小概率值=0.001的独立性检验,能否认为该企业员工体重是否超标与性别有关?(2)若以样本估计总体,用频率作为相应事件的概率.现从该大型企业的男、女员工中各随机抽取一名员工的体检报告,求抽到的两人中恰有一人体重超标的概率.解析(1)零假设为H0:体重是否超标与性别无关.依题意可得22列联表如下:超标不超标合计男16420女51520合计211940所以2=40(161545)22020211912.1310.828=x0.001, 根据小概率值=0.001的独立性检验,没有充分证据推断H0成立,因此可以认为
19、H0不成立,即认为该企业员工体重是否超标与性别有关.(2)由题意知,从男员工中随机抽取一人,体重超标的概率为45,不超标的概率为15;从女员工中随机抽取一人,体重超标的概率为14,不超标的概率为34.所以所求概率P=4534+1514=1320.2.(2023届河北河间一中开学考,20)某市一隧道由于机动车常在隧道内变道、超速,进而引发交通事故,交管部门在该隧道内安装了监控测速装置,并将该隧道某日所有车辆的通行速度进行统计,如图所示.已知通过该隧道车辆的平均速度为64 kmh-1.(1)求a,b的值,并估计这一天通过该隧道车辆速度的中位数;(2)为了调查在该隧道内安装监控测速装置的必要性,研究
20、人员随机抽查了通过该隧道的200名司机,得到的答复统计如表所示,根据小概率值=0.01的独立性检验,能否认为对安装监控测速装置的态度与司机的性别相关?认为安装监控测速装置十分必要认为安装监控测速装置没有必要男司机7030女司机5050附:2=n(adbc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.0.1000.0500.0100.001x2.7063.8416.63510.828解析(1)根据频率和为1可得10(a+b+0.02+0.01)=1,化简得a+b=0.07,又450.1+550.2+6510a+7510b=64,所以65a+75b=4.85,联立解得,a=
21、0.04,b=0.03.因为(0.01+0.02)10=0.30.5,所以所求的中位数为60+0.510(0.01+0.02)0.410=65.(2)零假设为H0:对安装监控测速装置的态度与司机的性别无关.根据表中数据,计算2=200(70503050)2100100801208.3336.635=x0.01.根据小概率值=0.01的独立性检验,没有充分证据推断H0成立,因此可以认为H0不成立,即认为对安装监控测速装置的态度与司机的性别相关.3.(2023届广东六校联考,20)足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战在2022年11月21日打响,决赛于12月18日晚进行,全程为期2
22、8天.(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到22列联表如下:喜爱足球运动不喜爱足球运动合计男性6040100女性2080100合计80120200依据小概率值=0.001的独立性检验,能否认为喜爱足球运动与性别有关?(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为Pn,即P1=1.(i)求P3(直接写出结果即可);(ii)证明:数列Pn14为等比数列,并比较第
23、19次与第20次触球者是甲的概率的大小.附:2=n(adbc)2(a+b)(c+d)(a+c)(b+d)0.100.050.0100.0050.001x2.7063.8416.6357.87910.828解析(1)零假设H0:喜爱足球运动与性别无关,根据列联表数据计算得2=200(60802040)210010080120=100310.828=x0.001,根据小概率值=0.001的独立性检验,我们推断H0不成立,即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过0.001.(2)(i)由题意得:第二次触球者为乙,丙,丁中的一个,第二次触球者传给包括甲的三人中的一人,故传给甲的概率为13
24、,故P3=13.(ii)第n次触球者是甲的概率为Pn,则当n2时,第n-1次触球者是甲的概率为Pn-1,第n-1次触球者不是甲的概率为1-Pn-1,则Pn=Pn-10+(1-Pn-1)13=13(1-Pn-1),从而Pn-14=13Pn114,又P1-14=34,Pn14是以34为首项,-13为公比的等比数列.则Pn=3413n1+14,P19=341318+1414,P20=341319+14P20,故第19次触球者是甲的概率大.专题综合检测一、单项选择题1.(2019课标,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分
25、,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A2.(2022湖北八市联考,3)从装有2个红球和2个黑球的袋子内任取2个球,下列选项中是互斥而不对立的两个事件的是()A.“至少有1个红球”与“都是黑球”B.“恰好有1个红球”与“恰好有1个黑球”C.“至少有1个黑球”与“至少有1个红球”D.“都是红球”与“都是黑球”答案D3.(2022重庆云阳江口中学期末,8)高三(1)班举行英语演讲比赛,共有六名同学进入决赛,在安排出场顺序时,甲排在后三位,且丙、丁排在一起的概率为()A.13B.16C.39180D.47180答案B4.(20
26、22河北省级联测联考五,4)小明参加某项测试,该测试一共3道试题,每道试题做对得5分,做错得0分,没有中间分,小明答对第1,2题的概率都是12,答对第3题的概率是13,则小明答完这3道题的得分期望为()A.2512B.6512C.203D.253答案C5.(2023届江苏常州一中检测,4)已知两个随机变量X,Y,其中XB4,14,YN(,2)(0),若E(X)=E(Y),且P(|Y|3)=()A.0.4B.0.3C.0.2D.0.1答案D6.(2023届长沙雅礼中学月考一,6)某工厂有甲,乙两个生产车间,所生产的同一批产品合格率分别是99%和98%,已知某批产品的60%和40%分别是甲,乙两个
27、车间生产,质量跟踪小组从中随机抽取一件,发现不合格,则该产品是由甲车间生产的概率为()A.34B.47C.12D.37答案D7.(2022重庆八中调研检测七,4)考察下列两个问题:已知随机变量XB(n,p),且E(X)=4,D(X)=2,记P(X=1)=a;甲、乙、丙三人随机到某3个景点去旅游,每人只去一个景点,设A表示“甲、乙、丙所去的景点互不相同”,B表示“有一个景点仅甲一人去旅游”,记P(A|B)=b,则()A.a=123,b=12B.a=124,b=122C.a=125,b=12D.a=126,b=122答案C二、多项选择题8.(2022湖南三湘名校联盟联考,11)记数列an的前n项和为Sn,已知Sn=an2-4an+b,在数集-1,0,1中随机抽取一个数作为a,在数集-3,0,3中随机抽取一个数作为b.在这些不同数列中随机抽取一个数列an,下列结论正确的是()A.an是等差数列的概率为13B.an是递增数列的概率为29C.an是递减数列的概率为13D.SnS2(nN*)的概率为13答案AB9.(2022石家庄二中月考,10)下列命题中,正确的是()A.已知随机变量X服从二项分布B(n,p),