ImageVerifierCode 换一换
格式:PPT , 页数:75 ,大小:3.64MB ,
资源ID:2505192      下载积分:9 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wnwk.com/docdown/2505192.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2022年医学专题—医用SAS统计分析四(1).ppt)为本站会员(la****1)主动上传,蜗牛文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蜗牛文库(发送邮件至admin@wnwk.com或直接QQ联系客服),我们立即给予删除!

2022年医学专题—医用SAS统计分析四(1).ppt

1、医用SAS统计分析,第五(d w)讲,6/26/2023,1,第一页,共七十五页。,一、多元线性回归 基本概念 多元线性回归简称多元回归,是研究一个应变量与多个自变量间线性依存关系数量(shling)变化规律的一种方法。多元线性回归方程,式中:b0为回归方程常数项,bj(j=1,2,,m)为偏回归系数,即在其他自变量固定的条件下,Xj改变(gibin)一个单位时应变量的改变(gibin)量。,6/26/2023,2,第二页,共七十五页。,多元线性回归方程的应用 预测应变量的估计值 探索影响(yngxing)应变量y的主要因素当X为某一定值时,估计应变量y的容许区间当X为某一定值时,估计其应变量

2、 的总体均数 的置信区间,6/26/2023,3,第三页,共七十五页。,语句格式 同单变量线性回归基本相同。proc reg 选项;model 应变量=自变量名列/选项;必选语句,定义回归分析模型 proc reg 语句的选项 data=数据集 指明回归分析(fnx)所用的数据集。outset=数据集 指定一个输出数据集,用以存储回归分析所得的参数估计。simple 输出每个变量的简单统计结果。,6/26/2023,4,第四页,共七十五页。,model语句的选项 selection=method 规定变量筛选方法,method可以是以下几种选项:forward(或 f)前进法,按照sle规定的

3、P值从无到有依次选一个变量进入模型 backward(或 b)后退法,按照sls规定的P值从含有全部变量的模型开始,以次剔除一个变量。stepwise 逐步(zhb)法,按照sle的标准依次选入变量,同时对模型中现有的变量按sls的标准剔除不显著的变量。注:选项中没有selection语句时,模型中含有全部自变量的回归模型。sle=概率值 入选标准,规定变量入选模型的显著性水平,前进法默认为0.5,逐步法默认为0.15。sls=概率值 剔除标准,指定变量保留在模型的显著性水平,后退法默认为0.1,逐步法默认为0.15。,6/26/2023,5,第五页,共七十五页。,stb 输出各自变量的标准偏

4、回归系数。cli 输出个体y值的95%容许区间上下限 clm 输出预测值均值 的95%可信区间上下限。P 输出实际(shj)值Yi,预测值、残差及其标准误。tol 输出各自变量的容许值。0tol值1,越接近于0,共线性越严重。vif 输出各自变量的方差膨胀因子。当vif10时,可认为多元共线性严重存在。collin 要求详细分析自变量之间的共线性,给出信息矩阵的特征根、条件指数和方差比,当条件指数10,方差比0.5时,可认为存在多元共线性。collinoint 与选择项collin作用相同,但不包括回归常数。R 进行预测值的残差分析(即异常值识别与强影响分析),输出学生化残差值和Cooks距离

5、D值。当学生化残差值2时,所对应的点可能是异常点,当D值0.5时,可认为对应的变量值对回归函数是强影响点。,6/26/2023,6,第六页,共七十五页。,完全多元线性回归 例7-7 10名女中学生的体重(tzhng)(X1,kg),胸围(X2,cm),胸围的呼吸差(X3,cm)及肺活量(Y,ml)的资料如下表所示。现作应变量Y对自变量X1,X2,X3的三元线性回归方程。,data mreg1;input x1 x2 x3 y;cards;35 69 0.7 160040 74 2.5 260040 64 2.0 210042 74 3.0 265037 72 1.1 240045 68 1.5

6、 2200,43 78 4.3 275037 66 2.0 160044 70 3.2 275042 65 3.0 2500;proc reg;model y=x1 x2 x3/stb;run;,6/26/2023,7,第七页,共七十五页。,Model:MODEL1Dependent Variable:Y Analysis of Variance Sum of MeanSource DF Squares Square F Value ProbFModel 3 1250109.0678 416703.02259 5.617 0.0355Error 6 445140.93222 74190.155

7、37C Total 9 1695250 Root MSE 272.37870 R-square 0.7374 Dep Mean 2315.00000 Adj R-sq 0.6061 C.V.11.76582,6/26/2023,8,第八页,共七十五页。,Parameter Estimates Parameter Standard T for H0:Variable DF Estimate Error Parameter=0 Prob|T|INTERCEP 1-3035.536354 2168.6738473-1.400 0.2111 X1 1 60.931823 36.29713798 1.6

8、79 0.1442 X2 1 37.808334 22.98080891 1.645 0.1510 X3 1 101.379460 121.97470310 0.831 0.4377 StandardizedVariable EstimateINTERCEP 0.00000000X1 0.46445689X2 0.39174762X3 0.25399450,6/26/2023,9,第九页,共七十五页。,逐步回归 简介 逐步回归是筛选自变量的常用的方法之一。筛选自变量的方法还有前进法,后退法和最优回归子集法。逐步回归法是依据事先给定的两个显著性水平SLE和SLS,将自变量逐个引入方程,同时每引入

9、一个新变量后,对已选入的变量要进行逐个检验,将不显著的变量剔除,这样保证最后所得的变量都有显著性。自变量间的多重共线性(multicollinearity)整个回归方程的统计检验P 的矛盾现象。偏回归系数的估计值明显与实际情况不符,或者是偏回归系数的符号与专业知识的情况相反。,6/26/2023,10,第十页,共七十五页。,据专业知识,该自变量与应变量间关系密切,而偏回归系数检验结果P。增加(或删除)一个变量,或者改变(或去除)一个观察值,引起回归系数估计值发生大的变化。多重共线性是引起上述问题的重要原因。解决(jiju)多重共线性的办法 用主成分估计等有偏估计替代最小二乘估计。用逐步回归等方

10、法筛选自变量。如上例7-7,整个回归模型P=0.0355,而b0,b1,b2,b3P值均大于0.05。估计变量之间存在共线性问题。,6/26/2023,11,第十一页,共七十五页。,程序(chngx)7-13,data stepreg1;input x1 x2 x3 y;cards;35 69 0.7 160040 74 2.5 260040 64 2.0 210042 74 3.0 265037 72 1.1 240045 68 1.5 220043 78 4.3 275037 66 2.0 160044 70 3.2 275042 65 3.0 2500;,proc reg;model y

11、=x1-x3/stb tol vif collin collinoint R;model y=x1-x3/selection=stepwise sle=0.25 sls=0.25 stb;run;,6/26/2023,12,第十二页,共七十五页。,例(医学统计学王洁贞主编,例15.1)某科研协作组调查某煤矿期高血压病患者40例,X1为工作面污染程度等级,X2为井下工龄(年),X3为体重(kg),X4为吸烟年限(ninxin)(年),X5为饮酒年限(ninxin)(年),Y为收缩压(kPa),试作多元线性回归分析。data stepreg2;infile d:sassas5wang15_1.tx

12、t;input id x1 x2 x3 x4 x5 y;proc reg;model y=x1-x5/stb tol vif collin collinoint r;model y=x1-x5/selection=stepwise sle=0.05 sls=0.05 stb;run;,6/26/2023,13,第十三页,共七十五页。,二、多元线性相关 研究多个变量间线性关系的一种统计分析方法。变量间相关系数有以下三类:简单相关系数 它是说明(shumng)两个变量相关程度和方向(不考虑其他变量的影响)的统计指标(ri,j)。偏相关系数 它是当其他变量固定时,说明某两个变量间相关程度和方向的统计

13、指标(如r12,3)。复相关系数R 亦称为全相关系数。说明应变量与各自变量的线性关系的密切程度。决定系数 R2 复相关系数的平方。它说明应变量的变异中由各自变量的改变而引起的占多少。如R2=0.8,则说明应变量的变异中有80%由自变量的改变而引起的。,6/26/2023,14,第十四页,共七十五页。,程序7-12data mcorr1;infile d:sassas5mcorr1.txt;input x1 x2 x3 y;proc corr nosimple;/*禁止一些简单统计量的输出*/var x1 x2 x3 y;/*包括(boku)了所有变量,实际可以省略*/proc corr nos

14、imple;var x1 x2;partial x3;/*partial语句的作用是固定x3*/proc corr nosimple;var x1 x2;partial x3 y;/*partial语句的作用是固定x3和y*/run;,6/26/2023,15,第十五页,共七十五页。,三、Logistic回归分析 简介 Logistic回归模型是适用(shyng)于应变量(因变量)为分类变量的回归分析。当应变量为分类变量时,如应变量结果为二分类变量的发病、不发病,生存、死亡等,是不能用多元线性回归模型(Y=0+i xi)来分析各种危险因素与应变量之间的关系的。因为应变量Y只能取值为1和0。不符

15、合线性回归模型中应变量Y应具有正态分布和方差齐性的要求,同时线性回归模型得到的Y值会出现大于1或小于0的不合理结果,显然不能用线性回归建立预测模型。以发病为例,发病的概率为P,不发病的概率为1-P,0P1。,公式(gngsh)等号左边简称为logit(P),即logit(P)=0+i xi,可证明(zhngmng),无论Y得何值,均0P1。上式可推导为:,6/26/2023,16,第十六页,共七十五页。,Logistic回归的应用 logistic回归在流行病学和临床流行病学等方面应用广泛,既可用于前瞻性的队列研究,又可用于回顾性的病例(bngl)对照研究。常用于:,病因学分析(fnx);,预

16、后(yhu)分析;,鉴别诊断;,评价治疗措施;,毒物的半数效量和联合作用,6/26/2023,17,第十七页,共七十五页。,Logistic回归的分类 按应变量的类型分类为:两分类的Logistic回归 非条件logistic回归 即研究对象未经过配对(pi du)。(在SAS中调用logistic模块进行统计)。条件logistic回归 即在配对病例对照研究中的1:1和1:M及N:M配对。(在SAS中调用Phreg模块进行统计)。多分类有序反应变量的Logistic回归(在SAS中调用logistic模块进行统计)。多分类无序反应变量的Logistic回归(在SAS中调用Catmod模块进行统计)。本讲主要介绍两分类Logistic回归,6/26/2023,18,第十八页,共七十五页。,两分类(fn li)非条件Logistic回归 语法格式 Proc logistic data=数据集 选项;model 应变量名=自变量名列/选项;freq;可选项,指明频数变量。output;output语句创建一个新的SAS数据集,其含有每个个体的原始数据,pred|p=变量名为在out=数据集

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2