1、第七章 诊断实验的评价 案 例 一位54岁的美国高中教师,前往她的社区医生处进行年度体检。主诉既往身体健康,无不适。一年前曾有一次短暂的发热史,未经治疗已经缓解。医生对其进行了身体检查,包括乳房触诊、妇科查体等均无异常。建议患者进行乳腺钼钯X线检查,结果提示异常。于是进一步进行细针穿刺抽吸乳腺组织活检Fine-needle aspiration,FNA检测,FNA病理结果显示有癌细胞。于是患者被安排1周后手术。手术的同时又做了病理切片,结果确诊为乳腺癌。注:FNA检测结果可分为以下三种:一是良性不存在癌细胞;二是可疑有变异细胞还不确定是否为癌细胞;三是存在癌细胞。问 题 1.该患者无不适主诉,
2、乳房触诊等物理诊断均无异常,为何医生还要对其行乳腺钼钯X线检查?2.既然钼钯X线检查已提示为异常,为何还要进一步行FNA检测,增加患者的痛苦、创伤和诊疗费用?3.手术活检是乳腺癌确诊的最终依据,假设该患者的X线检查为异常,而FNA检查为正常,是否有必要进一步行外科手术活检?提 示 50岁以上的妇女,在乳房触诊正常的情况下,患乳腺癌的几率为0.3%钼钯X线检测异常那么有13%的可能患乳腺癌 FNA检测结果为阳性,患乳腺癌的可能性为64%4.对于乳腺触诊无可疑包块而钼钯X线摄片异常者,假设FNA检查为正常,那么有99%的把握可排除乳腺癌即只有1%的可能性是乳腺癌。那么外科手术可考虑暂时不做,建议其
3、定期体检、随访,复查乳腺钼钯X线。筛检与诊断步骤示意图 定期 治疗性 干预 诊断诊断diagnosis)不仅包括各种实验室检查,也包不仅包括各种实验室检查,也包括病史体检所获得的临床资料、括病史体检所获得的临床资料、X X线、线、超声等各种公认的诊断标准,并且利超声等各种公认的诊断标准,并且利用这些资料和技术标准对疾病和健康用这些资料和技术标准对疾病和健康状况做出确切的结论。状况做出确切的结论。诊断试验诊断试验diagnostic testdiagnostic test:泛指在:泛指在诊疗过程中进行的各种以诊断为目的诊疗过程中进行的各种以诊断为目的的检查手段。是把病人与可疑有病但的检查手段。是
4、把病人与可疑有病但实际无病的人区别开来。实际无病的人区别开来。案 例 Bibbo等人选择114例乳腺触诊无可疑包块而钼钯X线检查异常的女性病例,先行FNA检测,随后在同侧乳腺做了手术活检,结果见表1。表1 FNA检测与手术活检诊断乳腺癌的比较 手术活检 FNA检测 乳腺癌 非乳腺癌 合计 阳性 14 8 22 阴性 1 91 92 合计 15 99 114 问题4:对FNA检测乳腺癌的真实性如何进行评价?目标人群目标人群 阳性阳性 阴性阴性 阳性阳性 阴性阴性 病人病人 非病人非病人 待评待评价的价的试验试验 a b c d 筛检试验的评价程序筛检试验的评价程序 金标准金标准 第二节 筛检试验
5、的评价 试 验 金 标 准 合 计 病例 非病例 阳 性 真阳性(a)假阳性(b)总阳性人数(a+b,r1)阴 性 假阴性(c)真阴性(d)总阴性人数(c+d,r2)合 计 患者总数 非患者总数 受检查人数 (a+c,c1)(b+d,c2)(a+b+c+d,n)评价:真实性、可靠性、实用性 第二节 筛检试验的评价 一、真实性validity)P86 真实性:指测量值与实际值金标准的真实性:指测量值与实际值金标准的测量值符合的程度。测量值符合的程度。灵敏度灵敏度sensitivity,Se和假阴性率和假阴性率漏诊率漏诊率,fasle negative rate,FN 特异度特异度specific
6、ity,Sp和假阳性率和假阳性率误诊率误诊率,fasle positive rate,FP 约登指数正确指数,约登指数正确指数,r 符合率符合率agreement rate)预测值预测值 似然比似然比likelihood ratio,LR)评价试验的真实性 试 验 金标准 合计 病例 非病例 阳 性 a b a+b 阴 性 c d c+d 合 计 a+c b+d a+b+c+d 假阴性率 c/a+c 特异度 d/b+d 灵敏度 a/a+c 假阳性率 b/b+d r 灵敏度特异度灵敏度特异度1 1假阳性率假阴性率假阳性率假阴性率 r值范围在值范围在01之间之间 r越大,准确性越高,与实际越符合越
7、大,准确性越高,与实际越符合 正确诊断指数正确诊断指数Youdens index,r 真实性指标 预测值:指真阳阴性人数占试验结果阳阴性人数的百分比,又称验后概率PV。试 验 金标准 合计 病例 非病例 阳 性 a b a+b 阴 性 c d c+d 合 计 a+c b+d a+b+c+d 阴性 预测值 d/c+d 阳性 预测值 a/a+b 患病率 a+c/a+b+c+d 验前概率 似然比似然比 (likelihood ratio,LR)即病人中出现某种试验结果的概率与即病人中出现某种试验结果的概率与非病人中出现相应结果的概率之比,非病人中出现相应结果的概率之比,说明病人出现该结果的时机是非病
8、人说明病人出现该结果的时机是非病人的多少倍。的多少倍。是一个相对稳定的综合性评价指标,是一个相对稳定的综合性评价指标,不受患病率影响。不受患病率影响。阳性似然比阳性似然比 筛检试验结果的真阳性率与假阳性筛检试验结果的真阳性率与假阳性率之比。比值越大诊断价值越高。率之比。比值越大诊断价值越高。特异度灵敏度假阳性率真阳性率1LR 阴性似然比阴性似然比 筛检试验结果的假阴性率与真阴性筛检试验结果的假阴性率与真阴性率之比。比值越小诊断价值越高。率之比。比值越小诊断价值越高。特异度灵敏度真阴性率假阴性率1LR评价结果 灵敏度=93.33%假阴性率=6.67%特异度=91.91%假阳性率=8.09%约登指
9、数=0.8524 阳性似然比=11.54 阴性似然比=0.07 阳性预测值=63.6%阴性预测值=98.9%A 人数 测量值 正常人 病人 诊断点 正常人与病人的测量值呈独立分布正常人与病人的测量值呈独立分布 评价指标的相互关系及其应用 诊断点 正常人 病人 B 人数 测量值 正常人与病人的测量值呈连续分布正常人与病人的测量值呈连续分布 评价指标的相互关系及其应用 C 人数 测量值 重叠 正常人 病人 正常人与病人的测量值呈交叉分布正常人与病人的测量值呈交叉分布 评价指标的相互关系及其应用 评价指标的相互关系及其应用 灵敏度和特异度 P88 确定截断值确定截断值cut-off value)的的
10、原那么原那么 1漏掉一个可能病例的后果漏掉一个可能病例的后果 如果该病早期诊如果该病早期诊断和早期治疗可获得很好的治疗效果,否那么断和早期治疗可获得很好的治疗效果,否那么后果严重,此时应选择灵敏度高的判定标准,后果严重,此时应选择灵敏度高的判定标准,尽可能把所有的可疑病人都诊断出来。尽可能把所有的可疑病人都诊断出来。2.如果早期治疗的效果与临床期才开始治疗的如果早期治疗的效果与临床期才开始治疗的效果相近,那么应选择特异度高的判断标准,效果相近,那么应选择特异度高的判断标准,尽量减少假阳性。尽量减少假阳性。3.假阳性与假阴性的重要性相等假阳性与假阴性的重要性相等 当出现这种当出现这种情况时,可选
11、择灵敏度与特异度相等,或使正情况时,可选择灵敏度与特异度相等,或使正确指数最大的分界值作为判断标准。确指数最大的分界值作为判断标准。判断标准左移时,灵敏度增加,特异度下降,假阳性增加,将使诊断本钱增加。判断标准右移时,特异度增加,灵敏度下降,假阴性增加,将使漏诊率增加。预测值的影响因素预测值的影响因素:特异度、灵敏度、患病率特异度、灵敏度、患病率 灵敏度灵敏度患病率患病率 阳性预测值阳性预测值 灵敏度患病率灵敏度患病率+(1特异度特异度(1灵敏度灵敏度 (1患病率患病率)特异度特异度 阴性预测值阴性预测值 (1患病率患病率)特异特异度度+患病率患病率(1灵敏度灵敏度 0204060801000
12、20406080100患病率(%)预测值(%)患病率与预测值的关系 患病率患病率:患病率越高,阳性预测值越高:患病率越高,阳性预测值越高 案例关联分析 同年,Smith C等人选择317例乳腺触诊有可疑包块且钼钯X线检查异常的女性病例,同样先行FNA检测,随后在同侧乳腺做了手术活检,结果见表2和表3。表2 FNA检测与手术活检诊断乳腺癌的比较FNA可疑可判为阳性 手术活检 FNA检测 乳腺癌 非乳腺癌 合计 阳性 113 15 128 阴性 8 181 189 合计 121 196 317 表3 FNA检测与手术活检诊断乳腺癌的比较FNA可疑可判为阴性 手术活检 FNA检测 乳腺癌 非乳腺癌
13、合计 阳性 91 0 92 阴性 30 196 226 合计 121 196 317 患病率患病率(%)(%)灵敏灵敏度度(%)(%)特异特异度度(%)(%)诊断诊断 结果结果 诊断诊断 合计合计 阳性预阳性预 测值测值(%)(%)阴性预阴性预 测值测值(%)(%)乳腺癌乳腺癌 非乳腺癌非乳腺癌 13 93 92 14 8 22 64 1 91 92 99 合计合计 15 99 114 38 93 92 113 15 128 88 8 181 189 96 合计合计 121 196 317 38 75 100 91 0 91 100 30 196 226 87 合计合计 121 196 317
14、 灵敏度、特异度和患病率不同时乳腺癌诊断结果灵敏度、特异度和患病率不同时乳腺癌诊断结果 ROC曲线受试者工作特性曲线受试者工作特性曲线 诊断性试验用计量资料表达结果时,将测量值按大小顺序排列,可用任意测量值作为正常与异常的阈值计算敏感度和特异度。ROC曲线能将每个敏感度/假阳性率(1-特异度)对子,用图形表示出来,直观地表示整个敏感度/特异度变动范围及其特征。ROC曲线下面积应在0.51.0之间。0.5:准确性较低 0.7:准确性中等 0.9:准确性较高 对ROC曲线下的面积应作显著性检验显著性检验。ROC曲线:确定试验最正确诊断阈值曲线:确定试验最正确诊断阈值图中最接近左上方的图中最接近左上
15、方的A点点 CPK和EKG诊断心梗ROC曲线比较 0%0%20%20%40%40%60%60%80%80%100%100%0%0%20%20%40%40%60%60%80%80%100%100%CPKCPKEKGEKG 假阳性率假阳性率 真阳性率灵敏度 比较两种或两种以上试验的价值 案例分析 甲乙两位放射科医生阅读相同的乳腺癌钼钯X线摄片100张,读片结果列于表4。表4 两位放射科医生对100张乳腺钼钯X线摄片的读片结果 甲医生 乙医生 正常 异常 合计 正常 40a 20(b)60(r1)异常 4 (c)36(d)40(r2)合计 44(c1)56(c2)100(N)问题:甲乙两医生用钼钯X
16、线摄片诊断乳腺癌的可靠性如何?二、可靠性(reliability)可靠性信度、重复性或精密度:是指在相同的条件下,重复试验获得相同结果的稳定程度。影响试验可靠性的因素有:1受试对象自身的生物学变异 2观察者的变异:包括观察者间误差和观察者自身误差。3试验方法的变异:所使用的仪器、药品和试剂的变异。诊断试验可靠性的评价指标 计量资料:变异系数 CV=s/计数资料:符合率、卡帕Kappa值 a+d 符合率 =100%N Kappa值计算 简化公式简化公式 N(a+d)-(r1c1+r2c2)Kappa=N2-(r1c1+r2c2)观察一致率观察一致率(Po)=a+d/N 机遇一致率机遇一致率(Pc)=(r1 c1)/N+(r2 c2)/N/N 非机遇一致率非机遇一致率=1-Pc 实际一致率实际一致率=Po-Pc Kappa值值=Po-Pc/1-Pc Kappa值判断标准 Kappa值 一致性强度 0.40 差 0.40 中、高度 0.75 极好 本案例:符合率=76%Kappa=0.53 第三节第三节 提高试验效率的提高试验效率的方法方法 一、选择患病率高的人群增加验前概率 二、联合试验