1、Chinese Health Resources,November 2022,Vol.25,No.6http:/790生物样本库建设管理现状与建议吴立梦*,祖平*,何蓉,杨丹桐,夏寒,庄宇,胡逸欢,刘览,邵岑怡,操仪,张伊人,周瑶涵,肖萍上海市疾病预防控制中心,上海 200336【摘要】系统梳理国外生物样本库建设模式、国内生物样本库管理建设情况,探讨疾病预防控制系统内建立公共卫生生物样本库的机遇、优势和挑战,为今后指导疾病预防控制系统生物样本库建设管理的实际工作提出政策建议和解决途径。【关键词】生物样本库biobank;“采集-利用”模型“acquisition and utilization
2、”models;建设现状construction status;公共卫生public health;疾病预防控制disease control and prevention【引用】吴立梦,祖平,何蓉,等.生物样本库建设管理现状与建议J.中国卫生资源,2022,25(6):790-798.公共卫生本文链接 http:/doi.org/10.13688/ki.chr.2022.220634【基金项目】上海市卫生健康委员会面上科研课题“公共卫生样本库质量检测要求及其影响因素研究”(202040207)【作者简介】*共同第一作者:吴立梦,副主任技师,博士,主要从事生物样本管理、病原生物检测研究,;祖平
3、,副研究员,硕士,主要从事卫生政策与卫生事业管理研究, 【通信作者】肖萍,【中图分类号】R19;Q93-34 【文献标志码】A 【文章编号】1007-953X(2022)06-0790-092009年,时代周刊 将生物样本库列为“改变世界十大观念”之一,此后,生物样本库建设逐渐成为科学研究的大基建工程1。早在21世纪初,国际经济合作与发展组织(Organization for Economic Cooperation and Development,OECD)就预测生物样本资源对全球经济的推动作用,在 生物资源中心:展望生命科学和生物技术的未来 中将生物样本资源中心定义为由生物资源存储库及其服
4、务提供者组成,生物样本资源收集范围包括可培养生物体(微生物、植物、动物和人类细胞等)、生物体可复制成分(基因组、质粒、病毒、互补脱氧核糖核酸等)以及存活但尚不可培养的有机体、细胞、组织和含有这些收集物的分子、生理和结构信息以及相关生物信息学的数据库2。国 际 生 物 及 环 境 样 本 库 协 会(International Society for Biological and Environmental Repositories,ISBER)是1999年成立的国际较有影响力的生物样本库国际合作组织,是目前解决与生物和环境标本库相关的技术、法律、伦理和管理问题的最大的国际组织。ISBER 于2
5、005年发布第1版 生物样本库最佳实践,于2018年发布最新版本第4版,中国医药生物技术协会组织生物样本库分会将其翻译成中文版本。书中对生物样本库定义为“从广义上可以分为实体库或虚拟库,涉及到样本(样品)及其相关数据的采集、处理、贮存和(或)分发等一系列过程,用以支持当前及未来的科学研究。”其中出现“虚拟库”一词,使生物样本库的组织形式不再局限于实体库形式。“虚拟库”的原因,一方面是由于迅猛发展的网络和通信技术使分散在各地的生物样本在时间和空间上的同步成为可能,更多的是这种组织形式更利于今后生物样本的利用,而生物样本库的利用问题已成为许多成熟样本库亟待解决的问题。不同时期、不同机构对生物样本库
6、定义不同,反映生物样本库不断地发展变化,其建设管理模式正逐渐形成理论体系。1国外生物样本库实例英 国 生 物 样 本 库(UnitedKingdomBiobank,UKBiobank)是目前世界上规模最大的人类前瞻性队列研究样本库,为发现新的遗传关联和复杂性状的遗传基础提供了许多机会3。样本库收集来自英国各地的约 500 000 名年龄在 4069 岁居民的表型数据和健康相关信息,包括:个人生物测量数据、生活方式指标、血液和尿液的生物标志物以及身体和大脑成像,后续随访信息通过链接健康和医疗记录获得。样本库还获得所有参与者的全基因组基因型数据。美国国立癌症研究所(National Cancer
7、Institute,NCI)的癌症诊断计划(Cancer Diagnosis 791中国卫生资源 2022年11月 第25卷 第6期http:/Program,CDP)的生物存储库和生物样本研究分支(Biorepositories and Biospecimen Research Branch,BBRB)为全美生物医学研究界提供生物样本库方面的管理、工具、资源和政策建议,从而为患者提供转化研究和精准医学。BBRB 制定了生物样本库标准并促进生物样本科学研究,以指导临床癌症研究和其他利用生物样本的生物医学研究4。泛欧生物银行和生物分子资源研究基础设施联盟(Biobanking and Biomo
8、lecular Resources Research Infrastructure-European Research Infrastructure Consortium,BBMRI-ERIC)囊括515个机构,现存样本量超6 000万份5,旨在提高学术界和工业界之间的可访问性和互操作性,以有利于个性化医疗和疾病预防,促进新诊断技术、医疗设备和药物的开发。BBMRI-ERIC提出“专家中心”的概念,将其发展为竞争前的非营利领域的公私合作伙伴关系(Public-Private Partnerships,PPP),通过设立新的结构来执行在当前建立的产学合作模式下将面临困难的研究项目6。冰岛生物样本
9、库是世界上最早对Biobank进行尝试的国家。1998年,冰岛议会通过法案批准建立冰岛卫生部门数据库(Health Sector Database,HSD),将全国人口的医疗记录电子化存储于该数据库,选取健康者资料约27万人,鉴别常见病的遗传因素7。随后,冰岛议会许可私人公司(deCode Genetics)对HSD的12年管理权,由该公司将HSD同冰岛居民家谱信息和遗传数据连接。冰岛的这一尝试曾引起国际上关于伦理、法律以及社会问题的争议8。2012年,deCode Genetics公司由于金融风暴的打击,向法院申请破产并被制药公司Amgen收购成为旗下全资子公司9。2国外生物样本库建设模式国
10、外对已运行的生物样本库调查后发现存在样本利用率不高的问题,许多生物样本库建设的初衷往往是为了便于获得易于收集、数量丰富或品类相对稀缺的生物样本资源。样本利用率低会造成库存量不断增加,需要额外的存储土地空间、制冷设备等资源支持,增加维护成本,严重的话可导致生物样本库运转停止10,如新加坡样本库。国外研究者对生物样本“获取-利用”模型作了研究,希望通过选择合适的生物样本库模型来确保生物样本最佳利用,获得科学价值和社会价值的同时保证生物样本库的可持续发展。从生物样本“获取-利用”角度11可将生物样本库归纳成若干模型,如前瞻型样本库模型(研究者中心模型)、经典型样本库模型(样本中心模型)、数据聚焦型样
11、本库模型(数据中心模型)、虚拟库模型、基于人群的模型、研究联盟模型、临床试验模型、倡导者模型、存储模型等。一个生物样本库可能包含几个生物样本库模型,但通常会遵循一个主要模型,现就常见的3种模型开展讨论。2.1经典型样本库模型(生物样本中心模型)经典型样本库模型是以生物样本为中心的生物样本库模式。经典型生物样本库专注于收集多种特定疾病类型的生物样本,如:重大疾病、罕见病等,并已获得或可迅速收集与其生物样本相关的临床或随访结果数据。研究人员可利用已收集的生物样本预测生物标志物是否可用于疾病诊断和风险评估。经典型生物样本库比较突出问题是一些“陈旧”的生物样本可能不被新的研究者需要,这将导致样本利用率
12、下降,当生物样本逐年的采集量超过生物样本利用量时,生物样本库的存量将会增加,库存不断增加扩大导致对额外制冷保藏设备或其他存储的需求方式。样本“陈旧”的原因可能是随着生物技术和医学研究的进步,生物样本原来收集时的标准操作程序无法满足新的请求,例如,生物样本可能过小或核糖核酸(ribonucleic acid,RNA)长期保存后的质量不符合研究要求。因此,在经典生物样本库的设计和管理中,需要积极关注生物样本利用并实现收集和利用之间的平衡。应仔细考虑未来的存储能力并合理安排生物样本采集、样本资源转移方案和更积极的营销利用活动,例如,开发开放生物样本库数字化清单,开放给更多研究人员共享使用等措施。2.
13、2前瞻型样本库模型(研究者中心模型)前瞻型样本库模型是以研究者为中心的生物样本库模式,为满足研究者需求而前瞻性地采集生物样本和相关数据。研究者向生物样本库预先提出生物样本需求,包括:生物样本涉及的特定疾病诊断、样本数量、容量、体积、处理要求、运输要求和保藏要求等。当生物样本库建设定位以研究者为中心时,生物样本库在目标、管理、运营和基础设施建设上需将研究者需求作为优先考虑原则,比如:信息系统应更关注研究者对生物样本的需求。生物样本库在确定研究者需求并签订相关协议后开始采集相应生物样本。为了提高效率,生物样Chinese Health Resources,November 2022,Vol.25,
14、No.6http:/792本库需要采集入组比研究方案多的样本量用于后续筛选,因为在完成采集和质量控制后,一些生物样本无法满足研究者要求而变成“额外”样本,但这些“超量”样本可以被存入生物样本库以满足未来其他研究者需求,此时前瞻型生物样本库可以选择与经典型生物样本库建立工作伙伴关系,以共享“超量”样本资源。前瞻型生物样本库突出优点是大部分生物样本采集后迅速被研究者利用,因此对存储空间要求相对较低,而且可以更快速响应不断变化的医疗保健、科学技术发展。其缺点是罕见病和复杂标本等比较难采集的标本获取过程时间较长,不易获得后续临床随访患者结果。2.3数据聚焦型样本库模型(数据中心模型)数据聚焦型样本库模
15、型专注于生物样本分析后数据的生成、存储和分发给研究人员,而不仅仅将生物样本实物分发给研究人员。通常,数据聚焦型样本库会利用基于人口样本库的体液样本生成含有遗传信息的基因组数据,一旦生成数据就不需要保留大量的生物样本,最大限度地减少生物样本的存储需求。数据聚焦型样本库模型可通过促进与许多最终用户的广泛数据共享,最大限度地从非更新资源的生物样本中产生新知识。UKBiobank是此类型生物样本库中最成功的例子。UKBiobank由威康信托有限公司和英国医学研究委员会两家非营利组织资助,其建立目标是对威胁生命的重大疾病如:癌症、心脏病、卒中、糖尿病、关节炎、骨质疏松症、眼疾、抑郁症改进其预防、诊断和治
16、疗措施。UKBiobank收集约 50万英国成年志愿者的血液、尿液和临床信息并长期随访,计划随访时间为 30年。每份血液样本会被分析约 821 000 个单核苷酸多态性位点,结果可提供给约 7 500个登记注册会员。会员获取所需数据的成本取决于数据获得所需回收成本,平均约1 500英镑(含增值税)。数据聚焦样本库需要广泛的互联网技术基础设施来存储数据,知识生成可能仅限于某些领域,因为生成的数据受到预定义的收集样本种类、疾病类型、收集分析方法等的限制。3国内生物样本库建设与管理情况3.1国内生物样本库建设发展现状国内生物样本库从1994年开始发展至今已有28年,形成了各具特色的样本库。1994年,中国医学科学院作为国家级项目建立了中国第一家生物样本库,用于储备不同民族的永生化细胞系。中华民族永生细胞库隶属于中国科学院遗传与发育生物学研究所,是我国保藏人群数最多的人类遗传资源库,保存有我国各个民族及不同聚居地隔离群体样本,包括:血液、脱氧核糖核酸、血清及B淋巴母细胞系(lymphoblastoid cell line,LCL)。LCL是利用 Epstein-Barr(EB)病毒转化人的B细