1、GB/T40419-2021引言基因组序列变异研究的爆炸式增长产生了海量的实验数据,并以各种类型的数据格式储存在世界各地的众多数据库中。为了能有效地管理、分析和利用这些数据,当务之急就是要对数据进行标准化以实现全球范周内的交换与共享。国际标准制定组织针对这些数据已经或正在制定相关的标准,H7(Health Level Seven,健康信息交换与传输标准)是针对临床数据制定的标准,DICOM(Digital Imagingand Communcation in Medicine,.医学数字成像和通信)和JPEG(联合图像专家组)是针对影像数据制定的标准,而基因组序列变异置标语言(Genomie
2、Sequence Variation Markup Language,GSVML)是鉴于基因组序列变异一特别是SNP(Single Nucleotide Polymorphism,单核苷酸多态性)和STRP(Short Tandem Repeat Polymorphism,短串联重复多态性)对于改善人类健康的基因医学和药物基因组学具有重大的作用,并且它们是针对基因组数据、尤其是人类相关的DNA变异数据所制定的标准。GSVML开发情况说明见附录A。本文件为人类健康的基因组序列变异数据提供了一种数据交换格式,主要是针对SNP和STRP的案例给出了GSVML的规定。SNP和STRP是人类健康相关研究中主要的和简单的多态性,可以其为中心将本文件的应用扩展到其他序列变异数据中。6