1、高考数学,专题十一概率与统计11.5变量间的相关关系、统计案例,考点一变量间的相关关系1.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关.2.线性经验回归方程与最小二乘法设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),(xn,yn),由yi=bxi+a+ei(i=1,2,n),得|yi-(bxi+a)|=|ei|,显然|ei|越小,表示样本数据点离直线y=bx+a的竖直距离越小.通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线y=bx+a的“整体接近程度”.当a,b的取值为,时,Q达到最小
2、.将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.经验回归直线一定过点(,).,1).2)r0,表示成对样本数据正相关,散点图中点的分布从左下角到右上角;r0,表示成对样本数据负相关,散点图中点的分布从左上角到右下角.3)|r|越接近于1,成对样本数据的线性相关程度越强.4.刻画回归效果的方式1)残差图法在残差图中,残差比较均匀地落在以取值为0的横轴为对称轴的水平带状,3.样本相关系数r,区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.2)残差平
3、方和法残差平方和为(yi-)2,残差平方和越小,模型拟合效果越好.3)利用R2刻画拟合效果R2=1-.R2越大,模型的拟合效果越好,R2越小,模型的拟合效果越差.,考点二独立性检验1.22列联表假设两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其22列联表为,22列联表给出了成对分类变量数据的交叉分类频数.,2.独立性检验1)假定通过简单随机抽样得到了X和Y的抽样数据列联表,如表所示.,则2=.2)2独立性检验中几个常用的小概率值和相应的临界值.,考法一经验回归方程的求解与应用1.求经验回归方程的步骤1)计算出、+、x1y1+x2y2+xnyn;2)计算、;3)写出经验回归方
4、程=x+.2.经验回归方程的应用1)若已知经验回归方程(方程中无参数),则把自变量代入经验回归方程即可对因变量进行预测.2)若经验回归方程中有参数,则根据经验回归直线一定经过点(,)求出参数值,得到经验回归方程,进而完成预测.,例1(2016课标,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以,说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:yi=9.32,tiyi=40
5、.17,=0.55,2.646.参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=-.,解析(1)由折线图中数据和附注中参考数据得=4,(ti-)2=28,=0.55,(ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,r0.99.(4分)因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(6分)(2)由=1.331及(1)得=0.103,=-=1.331-0.10340.92.所以,y关于t的回归方程为=0.92+0.10t.(10分),将2016年对应的t=9代入回归方程得=0.9
6、2+0.109=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.(12分),考法二独立性检验的应用独立性检验的一般步骤1.提出零假设H0:X和Y相互独立,并给出在问题中的解释.2.根据抽样数据整理出22列联表,计算2的值,并与临界值x比较.3.根据检验规则得出推断结论.4.在X和Y不独立的情况下,根据需要,通过比较相应的频率分析X和Y间的影响规律.,例2某高校男、女学生人数基本相当,为了解该校英语四级考试情况,随机抽取了该校首次参加英语四级考试的男、女各50名学生的成绩,情况如下表:,(1)依据=0.01的独立性检验,能否认为该校首次参加英语四级考试的学生合格与性别有关?
7、(2)从这50名男生中任意选2人,求这2人中合格人数的分布列及数学期望;,(3)将抽取的这100 名学生合格的频率视为该校首次参加英语四级考试的每位学生合格的概率.若学生首次考试不合格,则经过一段时间的努力,第二次参加考试合格的概率会增加0.1.现从该校学生中任意抽取2名学生,求至多两次英语四级考试后,这两人全部合格的概率.附:2=,解析(1)零假设为H0:该校首次参加英语四级考试合格与性别无关.根据表中数据,计算得到2=6.256.635=x0.01,根据小概率值=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为该校首次参加英语四级考试的学生合格与性别无关.(2)设2人中合格人数为,则的所有可能取值为0,1,2,P(=0)=,P(=1)=,P(=2)=,所以的分布列为,所以E()=0+1+2=.(3)由已知得该校学生首次参加英语四级考试成绩合格的概率为,首次不合格第二次合格的概率为,所以两位同学都首次参加英语四级考试成绩合格的概率为=,两位同学其中一位首次合格,另一位同学首次不合格,第二次合格的概率为2=,两位同学都首次不合格,第二次都合格的概率为=,所以至多两次英语四级考试后,这两人全部合格的概率为+=0.960 4.,