1、Company Logo 传染病监测数据传染病监测数据 时空分析及早期预警的统计技术研究进展时空分析及早期预警的统计技术研究进展 四川大学华西公共卫生学院四川大学华西公共卫生学院 卫生统计学教授卫生统计学教授 李晓松李晓松 2009年年9月月26日日 昆明昆明 Company Logo 随着信息技术的迅速发展随着信息技术的迅速发展,已经和正在产生大量已经和正在产生大量各类公共卫生信息和数据各类公共卫生信息和数据。数据分析理论的滞后和分析技术的缺失数据分析理论的滞后和分析技术的缺失,数据所数据所隐含的知识并未被充分认识和利用隐含的知识并未被充分认识和利用,而这些知识而这些知识可能具有潜在的巨大应
2、用价值可能具有潜在的巨大应用价值。Company Logo 3S技术等先进技术的迅速发展和应用技术等先进技术的迅速发展和应用,为深为深入分析和揭示公共卫生信息数据间复杂的时入分析和揭示公共卫生信息数据间复杂的时间和空间关系间和空间关系,一方面提供了重要的基础技一方面提供了重要的基础技术平台术平台,另一方面又产生了新的数据源另一方面又产生了新的数据源。Company Logo 时空分析及早期预警统计技术研究进展时空分析及早期预警统计技术研究进展 贝叶斯时空分析技术贝叶斯时空分析技术(Bayesian Disease Mapping)多源监测数据分析技术多源监测数据分析技术(Multivariat
3、e Surveillance Data Analysis)贝叶斯网络和隐马尔科夫模型贝叶斯网络和隐马尔科夫模型 聚集性探测聚集性探测(Cluster Detection)Company Logo 贝叶斯时空分析技术贝叶斯时空分析技术 Bayesian Disease Mapping 多维度多维度 多尺度多尺度 多层次多层次 三个基本特征 传染病数据基本要素和特征 传染病数据是传染病流行过程及其相关因素关系的符号化表示。时态时态 位置位置 属性属性 三个基本要素 人们所观察到的传染病流行是一系列复杂的自然与社会因素综合作用的结果。所谓传染病“流行规律”可理解为 在自然与社会多源复杂因子作用下传染
4、病流行的时空变化及其 相关因素的时空共变轨迹。贝叶斯时空分析技术贝叶斯时空分析技术 从时间轴看,在揭示传染病发病(率)随时间发生变化的同时,揭示其在每个时点上发病(率)存在的空间变异;从空间轴看,在揭示传染病发病(率)随区域不同而发生变化的同时,揭示在这些异质的区域上发病(率)存在的时间变异。与此同时,还指揭示与传染病发病(率)上述时空变异所关联的各种因子及其变化。Company Logo Bayes学说是不同于经典统计学说是不同于经典统计(频率学派频率学派)的另一大统计学派的另一大统计学派,随着计算机技术随着计算机技术的发展和的发展和Markov Chain Monte Carlo(MCMC
5、)抽样算法的引入抽样算法的引入,Bayes方法方法得以迅速发展和广泛应用得以迅速发展和广泛应用。Company Logo Bayesian Disease Mapping的优势的优势 可利用人们对于传染病流行及其相关因素的先可利用人们对于传染病流行及其相关因素的先验知识确定先验分布验知识确定先验分布。由于传播特性由于传播特性,传染病流行常呈现出时空相关传染病流行常呈现出时空相关性性,Bayes建模可借用邻近时空信息建模可借用邻近时空信息。自然环境数据 传染病时空数据 时空建模平台 基于基于Bayes框架时空建模框架时空建模 的传染病流行规律多维度分析的传染病流行规律多维度分析 GIS RS 信
6、息 系统 Company Logo 基于基于Bayes框架建模充分反映了传染病数据的框架建模充分反映了传染病数据的 基本要素与特征基本要素与特征 多维度多维度 属性维属性维 时间维时间维 空间维空间维 多维度、多尺度和多层次 病例的基本人口学特征以及与病例的基本人口学特征以及与 流行相关的主要自然流行相关的主要自然/社会因素社会因素 随时间推移,各区域疟疾发病相对危险度连续发生变化 各区域间相对危险度存在差异(空间异质性)相邻区域相对危险度有相似性(空间相关性)降雨量与疟疾发病的数量关系(系数)随不同时期发生变化 亚马逊河区域某州某时期疟疾发病的相对危险度变化 96.1 96.12 97.12
7、 98.12 时间 系数 Aline A.Nobre,Alexandra M.Schmidt,Hedibert F.Lopes.Spatio-temporal models for mapping the incidence of malaria in Par.Environmetrics,2005,16:291 304.Company Logo 发病发病(率率)在在各个区域的时间变异各个区域的时间变异:各时点各时点(段段)的空间变异的空间变异。相关因素与发病相关因素与发病(率率)的影响、以及这种影响在的影响、以及这种影响在不同时间的变化和不同空间的变化。不同时间的变化和不同空间的变化。发病(
8、率)的空间相关性与异质性大小及其在时间上的变异。Company Logo 多尺度多尺度:传染病流行在不同时空尺度上表现出:传染病流行在不同时空尺度上表现出的特征可能不同。的特征可能不同。传染病时空信息在概化和细化过程中传染病时空信息在概化和细化过程中 反映出的特征渐变规律反映出的特征渐变规律 探索不同时空尺度间信息转换探索不同时空尺度间信息转换 及不同尺度的效应及不同尺度的效应 在全球尺度,可发现登革热广泛流行于北纬30 度和南纬20度之间。非洲、东南亚、西太平洋地区地区、美洲加勒比地区及欧洲部分境域 近10年其分布有向高纬度或高海拔地区扩散趋势 但如在地区尺度上如我国海南地区,它可能呈散在聚
9、集分布而未能呈现出任何规律。Company Logo 多层次多层次 国家 省 地市 区县 乡镇街道 个体 Company Logo 个体本身特征 +所在环境特征 个体是否发生传染病 Company Logo 个体个体(个案数据个案数据)和和环境环境(集合数据集合数据)因素的独立因素的独立和联合效应和联合效应 各层次因素对传染病发病各层次因素对传染病发病(率率)的影响以及对的影响以及对传染病发病传染病发病(率率)在不同层次之间变异的影响在不同层次之间变异的影响 Company Logo 聚集性探测聚集性探测 Cluster Detection Company Logo 回顾性和前瞻性两种分析策略
10、回顾性和前瞻性两种分析策略 回顾性分析:发病模式与病因探索回顾性分析:发病模式与病因探索 前瞻性分析:实时监测与早期预警前瞻性分析:实时监测与早期预警 Kullduff前瞻性时前瞻性时-空扫描统计量空扫描统计量 Rogerson空间模式监测方法空间模式监测方法 前瞻性聚集性探测方法前瞻性聚集性探测方法 Company Logo 目前我国部分地区用于预警的方法主要是单纯目前我国部分地区用于预警的方法主要是单纯时间聚集性探测方法时间聚集性探测方法。其主要目的是探测时间序列数据中发病例数异其主要目的是探测时间序列数据中发病例数异常增加的时点常增加的时点。单纯时间聚集性分析的单纯时间聚集性分析的主要不
11、足:主要不足:未利用疫情数据中的空间信息未利用疫情数据中的空间信息,难以难以及时及时、准确地预警准确地预警。国外的研究多开始于国外的研究多开始于2001年炭疽恐怖事件年炭疽恐怖事件后后,纽约纽约、华盛顿华盛顿、西雅图等地先后建立西雅图等地先后建立了早期预警系统试点了早期预警系统试点(时时-空扫描统计量和空扫描统计量和贝叶斯网络等技术贝叶斯网络等技术)。国内外预警系统研究的区别国内外预警系统研究的区别 探测方法 监测系统 国内 单纯时间聚集性探测 传统监测 国外 时空聚集性探测 症状监测 国内外预警系统研究的区别国内外预警系统研究的区别 探测方法 监测系统 国内 单纯时间聚集性探测 传统监测 国
12、外 时空聚集性探测 症状监测 Company Logo 前瞻性时空扫描统计量前瞻性时空扫描统计量 研究 区域 扫描窗口 病例 寻找病例最多的窗口:扫描统计量S Company Logo 由于传染病的特殊性,用于传染病监测的由于传染病的特殊性,用于传染病监测的扫描统计量,其构建更为复杂。扫描统计量,其构建更为复杂。传染病时空聚集性的特点传染病时空聚集性的特点 无法预知传染病爆发可能的规模 扫描窗口的大小应当是动态变化的扫描窗口的大小应当是动态变化的 传染病时空聚集性的特点 某些因素造成传染病发生数在时间和空间的自然变异:如季节性 应当对这些因素进行校正应当对这些因素进行校正 传染病时空聚集性的特
13、点 人口的地理分布不均匀 如:城市人口密度高于农村 应对人口密度的不均匀进行校正应对人口密度的不均匀进行校正 寻找病例最多的窗口:寻找病例最多的窗口:扫描统计量扫描统计量S 如何得到如何得到P 值值 寻找扫描统计量的概率分布?寻找扫描统计量的概率分布?非常复杂和困难的概率理论问题非常复杂和困难的概率理论问题 Company Logo 新近发展的新近发展的KullduffKullduff时空扫描统计量时空扫描统计量 扫描窗口大小可变扫描窗口大小可变 对非均匀的人口密度进行校正对非均匀的人口密度进行校正 采用蒙特卡罗随机化法进行假设检验采用蒙特卡罗随机化法进行假设检验,无需再无需再考虑扫描统计量的
14、概率分布考虑扫描统计量的概率分布 扫描窗口:一定地理区域扫描窗口:一定地理区域 空间扫描统计量 扫描窗口:一定时间长度 时间扫描统计量 时空扫描统计量 一定的时间长度一定的时间长度 一定的地理区域一定的地理区域 Company Logo 传染病早期预警系统传染病早期预警系统 与可视化平台与可视化平台 数据库数据库 网络直报系统网络直报系统 早期预警系统框架早期预警系统框架 数据获取 数据库数据库 探测算法探测算法 采用聚集性探测算法进行数据分析 网络直报系统网络直报系统 早期预警系统框架早期预警系统框架 数据库数据库 探测算法探测算法 地理信息系统地理信息系统 地理编码地理编码&可视化实现可视
15、化实现 网络直报系统网络直报系统 早期预警系统框架早期预警系统框架 数据库数据库 探测算法探测算法 地理信息系统地理信息系统 报告报告 早期预警系统框架早期预警系统框架 网络直报系统网络直报系统 Google Earth 可视化平台可视化平台 GE支持的图形为三维图形支持的图形为三维图形,较二维图形直观较二维图形直观,且可任意改变方位和视角进行查看且可任意改变方位和视角进行查看。GE提供的卫星影像信息包括了山川河流等地形提供的卫星影像信息包括了山川河流等地形地貌信息地貌信息,可结合上述环境信息查看聚集性探可结合上述环境信息查看聚集性探测结果测结果。除地理图形外除地理图形外,GE还可容纳预警信号
16、的相关重还可容纳预警信号的相关重要信息要信息。GE操作十分简便操作十分简便,便于推广应用便于推广应用。省级前瞻性时空聚集性探测结果图示省级前瞻性时空聚集性探测结果图示1 1 图7.12 区县级前瞻性时空聚集性探测结果图示1 图7.13 区县级前瞻性时空聚集性探测结果图示2 Figure.聚集性探测结果在聚集性探测结果在Google Earth上的平面透视图上的平面透视图(在预警信号所在位置点击鼠标左键,即可出现预警信号的详细信息,包括时间、地域、实际发病数、预期发病数、P值)时空两个维度聚集性探测的优势时空两个维度聚集性探测的优势 与单纯时间聚集性分析相比与单纯时间聚集性分析相比,时空聚时空聚集性分析集性分析信息更为详尽信息更为详尽,不仅可提示不仅可提示有无聚集性有无聚集性,还可对聚集性进行空间还可对聚集性进行空间定位定位。时空两个维度聚集性探测的优势时空两个维度聚集性探测的优势 时空聚集性分析充分利用了数据中时空聚集性分析充分利用了数据中的空间信息的空间信息,预警更为及时预警更为及时。H0:传染病无聚集性传染病无聚集性(病例随机分布病例随机分布)拒绝拒绝H0 对应爆发?对应爆发?“偶