1、第 14 卷 第 2 期 食 品 安 全 质 量 检 测 学 报 Vol.14 No.2 2023 年 1 月 Journal of Food Safety and Quality Jan.,2023 基金项目:国家重点研发计划项目(2019YFE0106600)Fund:Supported by the National Key Research and Development Plan of China(2019YFE0106600)*通信作者:高中山,博士,教授,主要研究方向为过敏原分子基础和诊断应用。E-mail:*Corresponding author:GAO Zhong-Shan
2、,Ph.D,Professor,College of Agriculture and Biotechnology,Zhejiang University,Hangzhou 310058,China.E-mail: 过敏原综合数据库 COMPARE 的介绍和应用 赵 岚1,高中山1,2*(1.浙江大学农业与生物技术学院,杭州 310058;2.浙江大学医学院过敏研究中心,杭州 310058)摘摘 要要:随着分子生物学和基因组、蛋白组学技术的高速发展,越来越多的过敏原蛋白得到鉴定。为了提高对过敏原的研究及其在食品安全上的应用,很多机构都建立了不同类型的过敏原数据库。本文详细介绍了由美国健康与环境科
3、学研究所(Health and Environmental Sciences Institute,HESI)协调组织国际合作团队建立的一个过敏原综合数据库 COMPARE(COMprehensive Protein Allergen REsource),该数据库通过高通量序列分选算法结合专家人工审核方法,从各个公共蛋白质数据库、其他过敏原数据库以及相关文献中筛选过敏原,每年更新一次。此外还开发了基于 FASTA 算法的序列比对工具 COMPASS(COMPare Analysis of Sequences with Software),允许用户进行实时序列比对。该数据库已广泛应用于新过敏原蛋白
4、的鉴定以及蛋白质潜在致敏性的评价,对于食品安全管理和保障有重要参考价值。本文通过对 COMPARE 数据库的全面介绍,旨在提高该数据库在我国的应用价值,推动过敏原分子生物信息学的研究以及食品安全的发展。关键词关键词:过敏原;数据库;COMPARE;生物信息学;序列比对;交叉反应;食品安全 Introduction and application of the COMPARE allergen database ZHAO Lan1,GAO Zhong-Shan1,2*(1.College of Agriculture and Biotechnology,Zhejiang University,H
5、angzhou 310058,China;2.Allergy Research Center,School of Medicine,Zhejiang University,Hangzhou 310058,China)ABSTRACT:With the development of molecular biology and genomes and proteomic technologies,more and more allergen components have been identified.In order to improve the efficiency of the resea
6、rch and the application in the food safety,several institutions have established various types of allergen databases.This study introduced a comprehensive allergen database named COMPARE(COMprehensive Protein Allergen REsource)which was developed by an international collaborative team coordinated by
7、 the Health and Environmental Sciences Institute(HESI),USA.The allergens listed in the COMPARE database were identified via a high-throughput,automated sequence sorting algorithm and manual curation of the annotated sequence entries retrieved from public protein sequence databases,other allergen dat
8、abases,and the relevant scientific literatures on a yearly basis.And COMPASS(COMPare Analysis of Sequences with Software),a built-in FASTA-based sequence comparison tool,was also developed,supporting real-time sequence comparisons.This database had been widely used in the identification of new aller
9、gen components and assessment of the potential protein allergenicity,contributing to food safety assurance and management.Through the comprehensive introduction of COMPARE database,this study aimed to improve the application value of COMPARE database in China,and promoted its utilization in bioinfor
10、matics of allergen DOI:10.19812/ki.jfsq11-5956/ts.2023.02.00244 食 品 安 全 质 量 检 测 学 报 第 14 卷 molecules research and food safety.KEY WORDS:allergen;database;COMprehensive Protein Allergen REsource;bioinformatics;sequence alignment;cross-reactivity;food safety 0 引 言 过去二十年间,随着经济的发展、环境的变化和人们生活方式、饮食结构等的改变,
11、各种食物过敏问题呈现增加 态 势1。常 见 的 过 敏 反 应 是 由 免 疫 球 蛋 白E(immunoglobulin E,IgE)抗体介导的一种获得性免疫疾病,又称型超敏反应,指机体对过敏原(大多是蛋白质)的过度免疫应答而引发的一系列皮肤、呼吸道、胃肠道、心血管、神经系统等症状,通常在接触过敏原的几分钟到两小时内出现24。过敏原是诱发过敏反应的关键物质,一般分布在少数几个蛋白家族中。同一蛋白家族的过敏原具有相似的结构和功能5,不同来源的过敏原之间存在着广泛的交叉反应,即已经对某一过敏原过敏的个体,在接触相似过敏原时而诱发的过敏反应。其发生的分子基础是不同来源的过敏原在氨基酸序列或立体结构
12、上具有相似性,可以被同种 IgE 抗体识别并结合,进而激发机体产生过敏症状6。因此可通过序列和立体结构的比对,对某些蛋白的潜在致敏性进行预测。根据世界卫生组织和粮食及农业组织(World Health Organization and Food and Agriculture Organization,WHO/FAO)的指南,在连续 80 个氨基酸中,与已知过敏原序列等同度超过 35%,可认为该蛋白具有潜在的致敏性7。随着致敏物质来源的增加和蛋白组学技术的快速发展,越来越多的过敏原得到鉴定。此外,需要进行潜在致敏性评价的物质,如新型食品、转基因作物等种类也在快速增长。为了提高过敏原研究的效率,
13、并让研究成果更好地服务于社会,不同类型的过敏原数据库应运而生89。本文主要介绍了过敏原综合数据库 COMPARE(COMprehensive Protein Allergen REsourse)的发展历程、数据收录标准和使用方法,旨在提高该数据库在过敏原分子生物信息中的研究及食品安全领域的应用。1 过敏原数据库概况 目前可以使用的公共过敏原数据库较多,其中最常用的包括由世界卫生组织下属的国际免疫学联合会所建立的过敏原 系 统 命 名 数 据 库 WHO/IUIS(International Union of Immunological Societies,http:/www.allergen.
14、org/)10,由内布拉斯加大学食物过敏研究和资源项目 FARRP(Food Allergy Research and Resource Program)所支持建立的 Allergen Online数据库(http:/www.allergenonline.org)11,由德克萨斯大学医学分部所建立的过敏原结构数据库 SDAP(Structural Database of Allergenic Proteins,https:/fermi.utmb.edu/)12,还有Allergome(http:/www.allergome.org/)8,13,过敏原家族数据库 AllFam(http:/www
15、.meduniwien.ac.at/allfam/)5,过敏原表位数据库IEDB(Immune Epitope Database,http:/www.iedb.org/)14,以及由我国广州医科大学附属第二医院的陶爱林建立的过敏原查询数据库 Allergenia(https:/ 1 所示。表 1 不同过敏原数据库的比较 Table 1 Comparison of the different allergen databases 数据库名称 主要特征 更新频率 运营与维护机构 创建时间WHO/IUIS 过敏原分子的医学官方命名数据库,包含过敏原序列及致敏性相关信息,有严格的收录标准;用户自主提交
16、鉴定的 过敏原 持续更新 世界卫生组织下属的国际免疫学联合会 2000 年Allergen Online 收录过敏原需要通过专家审查;主要包含过敏原序列及相关文献信息;数据库可下载,但部分过敏原缺乏致敏性信息 年度更新 内布拉斯加大学食物过敏研究和资源项目 2005 年Allergome 包含过敏原序列及相关文献,但没有经过严格审查,且部分过敏原命名与 IUIS 不一致 持续更新 意大利过敏原资源实验室 2003 年SDAP 主要收录过敏原分子结构相关信息,也具有序列比对工具2013 年之后无更新 德克萨斯大学医学部 2002 年IEDB 主要收录过敏原分子的表位信息,也可以对过敏原的表位进行预测,但用户界面相对复杂 季度更新 美国国家过敏和传染病 研究所 2006 年COMPARE 过敏原综合数据库,包含过敏原序列、相关文献、致敏性等信息,具有 COMPASS 在线序列比对工具;数据收录有较为严格的流程和标准 年度更新 美国健康与环境科学研究所 2016 年第 2 期 赵 岚,等:过敏原综合数据库 COMPARE 的介绍和应用 45 COMPARE(https:/comparedat