1、病例对照研究case-control study,同济大学医学院张丽娟 Ph.D.,1,第一页,共一百零一页。,病例对照研究设计应用史,1843年Guy:职业暴露与肺结核的关系最早的病例对照研究1926年Claypon:生殖因素与乳腺癌关系最早的符合现代病例对照概念的研究,2,第二页,共一百零一页。,二战后应用广泛60年代以来方法逐步完善,3,第三页,共一百零一页。,主要内容,概述研究实例设计与实施要点资料分析常见的偏倚及其控制,4,第四页,共一百零一页。,第一节 概 述,5,第五页,共一百零一页。,病例对照研究(case-control study):按照根本状态将研究对象分为病例和对照,分
2、别追溯其既往发病前所研究因素的暴露情况,并且进行比较,以推断疾病与暴露之间有无关联及关联强度大小的一种观察性研究。,一 根本概念,6,第六页,共一百零一页。,是一种回忆性的研究由结果探索病因的研究方法是在疾病发生后去追溯假定的病因因素的方法,7,第七页,共一百零一页。,?与历史性队列研究区别,8,第八页,共一百零一页。,9,二 病例对照研究根本原理,第九页,共一百零一页。,10,病例对照研究的根本设计思路,收集研究对象过去的暴露情况,在时间顺序上属回忆性质,因此又称回忆性研究,第十页,共一百零一页。,属于观察性研究要设立对照组观察方向由“果到“因一般不能确定因果关系,11,特 点,第十一页,共
3、一百零一页。,1广泛探索和深入研究疾病发生的影响因素2研究健康状态等事件发生的影响因素3疾病预后因素的研究4临床疗效影响因素的研究,12,三 病例对照研究目的,第十二页,共一百零一页。,1非匹配病例对照研究2匹配病例对照研究,13,四 病例对照研究类型,第十三页,共一百零一页。,非匹配的病例对照研究 欲探讨某社区45岁以上人群脑卒中发生的危险因素,可将该社区45岁以上的全部脑卒中病人和非病人或其随机样本作为研究对象,进行病例对照研究,如,14,第十四页,共一百零一页。,匹配的病例对照研究 成组匹配:指对照组具有某因素或特征者所占的比例与病例组一致 个体匹配:以个体为单位使病例和对照在某因素或特
4、征方面相同或相近,15,第十五页,共一百零一页。,第二节 研究实例,16,第十六页,共一百零一页。,案例1,我国是幽门螺杆菌Hp高感染和胃癌高发地区之一,基于描述性研究发现Hp感染率与胃癌死亡率呈正相关关系,我国学者对胃癌与Hp感染以及其他相关因素的关联进行了大量的流行病学研究。有人采用病例对照研究的方法研究了胃癌的危险因素。,17,第十七页,共一百零一页。,研究方法,1:1配对病例对照研究,18,第十八页,共一百零一页。,研究对象,病例组:2002.02-2004.02选取某市常住人口中,确诊为胃癌新发病例这298例作为病例组,19,第十九页,共一百零一页。,对照组:对照组选取与病例同性别、
5、居住同村或同一街道,年龄与病例相差不超过2岁,并有常住户口的非肿瘤居民,与病例组进行1:1配对,20,第二十页,共一百零一页。,研究内容,调查问卷:年龄、性别等一般人口学特征,烟酒嗜好、锻炼身体等行为因素,饮食习惯,既往病史及家族肿瘤史,21,第二十一页,共一百零一页。,所有调查者采静脉血7ml,分类血清,用ELISA法测定幽门螺杆菌IgG抗体,22,第二十二页,共一百零一页。,统计分析,SPSS10.0分析软件,计算比值比OR来估计各种危险因素与胃癌的关联强度。单因素分析的根底上,进行胃癌发病相关因素的多因素Logistic回归分析,23,第二十三页,共一百零一页。,结果,Hp感染OR=32
6、.62、精神压抑OR=19.50、胃溃疡OR=13.01、过量摄入肉类OR=12.88、喜食烟熏食品OR=6.99、恶性肿瘤家族史OR=5.55、喜食重盐饮食OR=3.01、吸烟量大OR=2.92、缺乏体育锻炼OR=2.18是胃癌危险因素,24,第二十四页,共一百零一页。,喜食香菇和蘑菇OR=0.443、喜食新鲜水果OR=0.665是胃癌的保护因素,25,第二十五页,共一百零一页。,结论,当地胃癌发生主要与幽门螺杆菌感染、精神压抑、胃溃疡史、过量摄入肉类、缺乏体育锻炼等因素有关。多食蘑菇和新鲜水果对胃癌发生有一定保护性作用。,26,第二十六页,共一百零一页。,27,研究背景,美国波士顿Vinc
7、ent纪念医院妇产科医生Herbst发现 19661969年收治7例阴道腺癌患者 年龄1522岁过去年龄均大于25岁,案例2,第二十七页,共一百零一页。,7例在1522岁之间7例全是腺癌阴道癌占女性生殖系统癌的2%阴道腺癌仅占阴道癌的5%10%,非常罕见,28,第二十八页,共一百零一页。,29,Herbst对阴道腺癌危险因素进行探索 7例患者加上另一个医院例患者作为病例组,研究方法,第二十九页,共一百零一页。,30,每个病人配4个对照,共32个对照 调查员用调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见下表,第三十页,共一百零一页。,31,研究结果,第三十一页,共一百零一
8、页。,研究结论,少女阴道腺癌的发生与其母亲此次怀孕服用雌激素OR=28.0、既往流产史OR=10.5、此次怀孕出血史OR=8.0等因素有关。,32,第三十二页,共一百零一页。,第三节 病例对照研究的设计和实施,33,第三十三页,共一百零一页。,病例对照研究实施步骤,34,第三十四页,共一百零一页。,1 提出病因假设,暴露?,疾病?,35,一 实施步骤,第三十五页,共一百零一页。,2 提出研究方案或设计明确研究目的,选择适宜的对照形式对象的来源与选择样本含量的估计暴露因素的定义及分级,36,第三十六页,共一百零一页。,设计调查表可能的偏倚和质量控制获取资料的方法资料整理与分析方法经费预算人员分工
9、及单位协调,37,第三十七页,共一百零一页。,3 收集资料,培训调查员与与调查开展正是调查,38,4 资料整理与分析,5 总结并提出研究报告,第三十八页,共一百零一页。,一 明确研究目的,即通过本次研究需要解决的问题,应具有科学性和实际可行性,39,二 设计要点,第三十九页,共一百零一页。,在进行课题研究之前,应通过文献复习了解所研究疾病已明确和可疑的危险因素及其研究现状和进展,了解前人所采用的研究方法和存在的问题,最后根据所获得的相关资料及自己和他人的经验,确定研究目的,40,第四十页,共一百零一页。,二 研究因素的选择,1 根据研究目确实定研究因素 充分考虑尽可能包括的有可能的有关因素,尽
10、可能从多个角度去研究暴露因素,41,第四十一页,共一百零一页。,2 研究因素一旦确定,必须对其暴露或暴露水平作出明确的规定 对研究因素的暴露状况应有明确的规定,研究因素的测量有定性和定量测量,定量测量最好可以分级,42,第四十二页,共一百零一页。,三 选择研究对象,1 病例的选择1病例的选择原那么和来源原那么:疾病的诊断标准客观、具体、可操作性抢,尽可能按国际及国内统一标准执行来源:医院、社区,43,第四十三页,共一百零一页。,2 病例的类型,新发病例(incident case):研究期间发生并诊断的病例 对暴露因素记忆忧新,信息可靠,但对发病率低的疾病,短期内不易获得足够数量的病例,44,
11、第四十四页,共一百零一页。,现患病例(prevalent case),人群中业已患某病的个体。数量容易满足,但提供的暴露史容易受病程迁延和病后行为方式的影响,45,第四十五页,共一百零一页。,死亡病例(death case),研究中收集保存史之前已死亡的病例死亡病例的资料往往通过调查死亡者家属或查阅历史资料而获得,信息偏倚较大,46,第四十六页,共一百零一页。,2 选择对照,1 选择对照的原那么原那么:代表性,可比性2 对照的来源来源:医院、自然人群,47,第四十七页,共一百零一页。,1:1个体匹配(individual matching),某些特征,配对(pair matching),3 对
12、照的类型,48,第四十八页,共一百零一页。,1:R个体匹配(individual matching),49,第四十九页,共一百零一页。,Matching,即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰,50,第五十页,共一百零一页。,匹配目的 提高研究效率 排除匹配混杂因素的干扰,51,第五十一页,共一百零一页。,注意不要,匹配过头overmatching:对并不应该匹配的因素进行匹配,结果使研究因素和疾病之间的真正关联减弱或消失,52,第五十二页,共一百零一页。,四样本含量的估计size of sample1 影响因素1对照组的暴露率P02病例组的暴露率
13、P13估计的OR值,第五十三页,共一百零一页。,4希望的显著性水平=0.05 or=0.01)5希望的把握度power或称成效,1-,54,第五十四页,共一百零一页。,提示,实际工作中,P0,P1和OR值主要通过查阅文献或预调查获得,55,第五十五页,共一百零一页。,2 计算1非匹配设计:病例数=对照数,第五十六页,共一百零一页。,例:吸烟与肺癌,预期OR=2.0,人群吸烟率(p0)=20%,定:a=0.05双侧b=0.1 查表得:Za=1.96 Zb=1.282 p1=(0.22)/(1+0.21)=0.333 P=(0.2+0.333)/2=0.267 q=1-0.267=0.733 n=
14、20.2670.733(1.96+1.282)2/0.333-0.2)2=232,57,第五十七页,共一百零一页。,2非匹配调查:病例数对照数设:病例数:对照数=1:c;那么病例数为:p1计算同上式;对照数=cn,第五十八页,共一百零一页。,31:1配对设计:Schlesselman公式总对子数:Mm/(p0q1+p1q0)m为结果不一致的对子数,59,p0;p1为目标人群中对照组和病例组估计暴露率,第五十九页,共一百零一页。,例:研究口服避孕药与先天性心脏病的关系,设a=0.05双侧,b=0.1;对照组暴露比例p0=0.3;预期OR=2.0 求:需要的总对子数?解:查表得:Za=1.96 Z
15、=1.282 p1=P0OR/1+p0(OR-1)=0.32/1+0.3(2-1)=0.46 p=OR/(1+OR)=2/(1+2)=2/3=0.67,第六十页,共一百零一页。,61,q1=1-p1=1-0.46=0.54q0=1-p0=1-0.3=0.7总对子数:Mm/(p0q1+p1q0)=90/(0.30.45+0.460.7)=186人,第六十一页,共一百零一页。,(41:R配比病例对照研究设计,62,N为病例所需例数,R*N为对照所需总例数,第六十二页,共一百零一页。,第四节 病例对照研究资料的整理分析,63,第六十三页,共一百零一页。,病例对照研究的资料分析,资料的整理 资料的分析
16、,64,第六十四页,共一百零一页。,一 资料的整理,资料质量核查:收集过程中,收集完成后仍要仔细核查,对资料缺乏或错误加以弥补和纠正 资料编号、归档、建库,65,第六十五页,共一百零一页。,二 资料的分析,描述性分析 一般特征描述、均衡性检验 联系的分析 统计推断 2 检验 计算OR,66,第六十六页,共一百零一页。,联系强度的计算,联系强度用比值比(odds ratio,OR)估计:病例组和对照组的暴露比值,67,第六十七页,共一百零一页。,68,第六十八页,共一百零一页。,69,OR与关联强度,第六十九页,共一百零一页。,70,如果能满足2个条件所研究疾病的发病率(患病率)很低(0.05)研究中所选择的研究对象代表性好 那么 OR RR,第七十页,共一百零一页。,1.不匹配不分层资料分析成组 检验 传统的四格表的专用公式 计算OR,第七十一页,共一百零一页。,72,第七十二页,共一百零一页。,73,例 口服避孕药(OC)与心肌梗死(MI)关系的病例对照研究,口服避孕药(OC)与心梗(MI)关系的病例对照研究结果,第七十三页,共一百零一页。,74,P0.05,拒绝无效假设,即两组暴露