1、第九章第九章 偏倚及其控制偏倚及其控制 Biases and Their Control 1、研究结果的变异性、研究结果的变异性 2、研究的真实性、研究的真实性 3、研究的偏倚、研究的偏倚 第一节第一节 研究结果的变异性研究结果的变异性 一、概述一、概述 变异性(变异性(variability):):研究结果的变动或波动叫研研究结果的变动或波动叫研究结果的变异性究结果的变异性 1、生物学变异和测量变异:主要来自个体、生物学变异和测量变异:主要来自个体(个体生(个体生物学变异;测量误差)物学变异;测量误差)、群体、群体(个体遗传学变异、(个体遗传学变异、环境变异测量误差)环境变异测量误差)和样本
2、和样本(抽样方式、样本大(抽样方式、样本大小和测量误差小和测量误差)2、随机变异和系统变异:前者成正态分布;后者的、随机变异和系统变异:前者成正态分布;后者的绝对值和方向保持恒定。绝对值和方向保持恒定。测量误差包括随机误差和系统误差测量误差包括随机误差和系统误差 二、个体水平差异二、个体水平差异 变异来源变异来源 特特 点点 个体状态个体状态 日间变异,年龄、膳食或运动改变,环境因素日间变异,年龄、膳食或运动改变,环境因素 测量误差测量误差 仪器标度差,精密度差,读数或记录错误仪器标度差,精密度差,读数或记录错误 三、群体水平的变异性三、群体水平的变异性 是各个体变异的累积是各个体变异的累积,
3、群体变异常大于个体群体变异常大于个体 可根据群体变异来确定正常值的范围可根据群体变异来确定正常值的范围 也受到测量误差的影响也受到测量误差的影响 四、样本水平的变异性四、样本水平的变异性 1、描述性结果样本变异:图、描述性结果样本变异:图81 2、分析性结果样本变异:图、分析性结果样本变异:图82 第二节第二节 研究的真实性研究的真实性 一、概述一、概述 真实性(效度;真实性(效度;validityvalidity):研究收集的:研究收集的数据、分析结果和所得结论与客观实际的数据、分析结果和所得结论与客观实际的符合程度。用真实性指数(符合程度。用真实性指数(index of index of
4、validity,IV)validity,IV)或灵敏度等表示。或灵敏度等表示。研究误差:研究结果与客观实际不符合的地方。分为系统研究误差:研究结果与客观实际不符合的地方。分为系统误差(偏异;误差(偏异;biasbias)和随机误差)和随机误差 可靠性(信度;可靠性(信度;reliabilityreliability;精密度;精密度;precision)precision):指研究中随机误差的大小程:指研究中随机误差的大小程度度 二、内部真实性(二、内部真实性(internal validity)指研究结果与实际研究对象真实情况的符指研究结果与实际研究对象真实情况的符合程度,指研究本身是否真实
5、合程度,指研究本身是否真实 真实性高,则系统误差和随机误差小真实性高,则系统误差和随机误差小 研究结果真实性差,不能应用于其他人群研究结果真实性差,不能应用于其他人群 三、外部真实性三、外部真实性(external validity)研究结果与推论对象真实情况的符合程度研究结果与推论对象真实情况的符合程度 增加研究对象的同质性,能改善内部真实增加研究对象的同质性,能改善内部真实性;性;增加研究对象的异质性,能改善外部真实增加研究对象的异质性,能改善外部真实性;性;应综合考虑研究对象的异质性和同质性应综合考虑研究对象的异质性和同质性 第三节第三节 研究的偏倚研究的偏倚 一、选择偏倚一、选择偏倚
6、定义:定义:选入研究样本的研究对象与未被选选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。入者之间特征差异造成的系统误差。描述性研究的选择偏倚:描述性研究的选择偏倚:体现在样本对总体的体现在样本对总体的代表性上代表性上 分析性研究的选择偏倚:分析性研究的选择偏倚:体现在研究对象进入、体现在研究对象进入、排除、不参与、失访等排除、不参与、失访等 二、信息偏倚二、信息偏倚 定义:定义:在从研究对象收取所需信息时产生的偏倚。其在从研究对象收取所需信息时产生的偏倚。其表现是使研究对象的某种特征被错误分类表现是使研究对象的某种特征被错误分类(misclassification)。)。同样存
7、在描述性研究和分析性研究的中同样存在描述性研究和分析性研究的中 无差异性错误分类(无差异性错误分类(nondifferential misclassification):暴暴露或疾病的错误分类与研究分组无关;大多数情况下,露或疾病的错误分类与研究分组无关;大多数情况下,模糊了组间差异,低估了研究效应模糊了组间差异,低估了研究效应 差异性错误分类(差异性错误分类(differential misclassification):暴露或:暴露或疾病的错误分类与研究分组有关,由于其差异偏向不同,疾病的错误分类与研究分组有关,由于其差异偏向不同,可高估或低估研究效应可高估或低估研究效应 无差异分类错误无
8、差异分类错误 高脂肪膳食 低脂肪膳食 心肌梗死 60 40 对照 40 60 高脂肪膳食 低脂肪膳食 心肌梗死 48 52 对照 32 68 高脂肪膳食 低脂肪膳食 心肌梗死 60 40 对照 40 60 高脂肪膳食 低脂肪膳食 心肌梗死 60 40 对照 32 68 研究真实数据 错误分类数据 研究真实数据 差异分类错误差异分类错误 错误分类数据 OR=2.3 OR=2.0 OR=2.3 OR=3.2 三、三、混杂偏倚混杂偏倚 定义:定义:在研究某因素与某疾病关联时,由于某个既与疾病有在研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因素的影响,制约关系,又
9、与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫混杂(响叫混杂(confoundingconfounding),其所带来的偏倚叫混杂偏倚),其所带来的偏倚叫混杂偏倚(confounding biasconfounding bias),该),该外来因素叫混杂因素外来因素叫混杂因素(confounding factor)confounding factor)。特点特点:(1 1)必须是所研究疾病的独立危险因子)必须是所研究疾病的独立危险因子 (2 2)必须与研究因素(暴露因素)有关)必须与研究因素(暴露因
10、素)有关 (3 3)必须不是研究因素与研究疾病因果链上中间变量)必须不是研究因素与研究疾病因果链上中间变量 由统计学关联到因果关联由统计学关联到因果关联 (一)统计学关联(一)统计学关联(association)偶然关联偶然关联 选择偏倚选择偏倚 提出提出 验证验证 关关 非因果关联非因果关联 观察偏倚观察偏倚 假设假设 假设假设 联联 混杂等混杂等 统计学关联统计学关联 间接因果关联间接因果关联 因果关联因果关联 直接因果关联直接因果关联 (二)因果关联(二)因果关联(causal association)黄色瘤黄色瘤(E)静脉吸毒静脉吸毒(E)1、继发、继发 2、直接、直接 关联关联 高血
11、清胆高血清胆?关联关联 性乱性乱(F)?胆固醇胆固醇(C)歪曲歪曲 冠心病冠心病(D)HIV感染感染(D)病因推断 四、混杂偏倚的分层分析四、混杂偏倚的分层分析 M-H(Mantel-Haenszel)分层分析方法的步骤 对可能的混杂因素进行分层 判定层间RR或OR是否相等或相近 得到控制混杂后的调整RR或OR 再将调整RR或OR与分层前的粗RR或粗OR(cRR或cOR)进行比较 1.队列研究(1)累计发病率资料 表 9-3 以累计发病率为研究指标的队列研究 新病例 未发病 合计 暴露组 ai bi N1i 非暴露组 ci di N0i 合计 M1i M0i Ti 2221010/1iiiii
12、MHiiiiiia dbcTN N M MTT01/iiiMHiiia NTRRc NT表8-4(2)发病密度资料 表 9-4 以发病密度为研究指标的队列研究 新病例 合计人时 暴露组 ai N1 非暴露组 ci N0 合计 M1i Ti 01/iiiMHiiia NTRRc NT2112110/iiiiMHiiiiaN MTM N NT表8-5 2.病例对照研究 表 9-5 非配比的病例对照研究 有暴露 无暴露 合计 病例组 ai bi m1i 对照组 ci di m0i 合计 ni n0 ti /iiiMHiiia dtORbct2221010/1iiiiiMHiiiiiia dbctm
13、m n ntt表8-6 (1)按可能的混杂因素吸烟分层 表 9-6 饮酒与肺癌病例对照研究 饮酒 不饮酒 合计 肺癌病例 24 10 34 对照 26 40 66 合计 50 50 100 表 9-7 饮酒与肺癌病例对照研究分层分析 吸烟层(i=1)不吸烟层(i=2)饮酒 不饮酒 小计 饮酒 不饮酒 小计 肺癌病例 21 6 27 3 4 7 对照 9 4 13 17 36 53 合计 30 10 40 20 40 60 表8-7 表8-8 ai bi m1i ci di m0i ni n0 ti (2)判定层间关联效应水平是否同质 按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同
14、质性检验)的,可以应用M-H方法计算综合OR 121 41.566 9OR23 361.594 17OR12OROR(3)计算综合或调整OR,并与粗OR比较 222221 46 19/403 364 17/600.650927 13 30 10/40 1 407 53 20 40/60 1 60 MH 21 4/403 36/601.576 9/404 17/60 MHOR 24 403.6910 26 cORMHcORORP 0.25(4)结论 吸烟对饮酒与肺癌的关联(cOR=3.69)有混杂作用(cOR ORMH)控制吸烟的混杂作用后,饮酒与肺癌无关联(=0.6509,P0.25)注意针对ORMH的2检验是在排除了混杂偏倚的基础上再排除随机误差,而针对cOR的2检验是建立在没有排除混杂偏倚的基础上的