1、I C S2 5 0 1 0J 0 4a 雪中华人民共和国国家标准G B T2 6 4 9 9 2 2 01 1机械科学数据第2 部分:数据元目录M a c h i n e r y-S c i e n c ed a t a P a r t2:D a t ae l e m e n td i r e c t o r y2 0 1 1 0 5-1 2 发布2 0 11 _ 1 0-0 1 实施丰瞀徽鬻瓣警矬瞥霎发布中国国家标准化管理委员会促1 9目次前言-引言一1 范围2 规范性引用文件3 术语和定义4 数据元描述说明5 数据元的类目分组6 数据元的维护与管理7 数据元目录8 数据元索引附录A(规范
2、性附录)机械科学数据元目录代码表明细参考文献一G B T2 6 4 9 9 2 2 0 11,2445鹂前言G B T2 6 4 9 9 2 2 0 11G B T2 6 4 9 9 机械科学数据分为四个部分:第1 部分:分级分类方法;第2 部分:数据元目录;第3 部分:元数据;第4 部分:交换格式。本部分为G B T2 6 4 9 9 的第2 部分。本部分附录A 为规范性附录。本部分由中国机械工业联合会提出。本部分由全国自动化系统与集成标准化技术委员会(S A C T C1 5 9)归口。本部分起草单位:北京中机科海科技发展有限公司、安徽京诺科技发展有限公司。本部分主要起草人:李春梅、李丽亚
3、、李艾丹、郭秋梅、吴来、薛中玉、李莹、王芳。G B T2 6 4 9 9 2 2 0”=r目G B T2 6 4 9 9(机械科学数据分为四个部分。第1 部分:分级分类方法,旨在通过对机械科学数据的分级分类进行规范,以便形成良好的机械科学数据共享机制,保护国家安全、社会公众利益和数据生产者的合法权益,促进机械科学数据的价值在广泛应用中得到更大的发挥和增值。第2 部分:数据元目录,旨在通过对机械科学数据的属性进行一致性和精确性的规范描述,保证具有相同概念的数据元在语义上统一、规范、无歧义,最大限度地消除数据描述的 昆乱现象。第3 部分:元数据,旨在通过对机械科学数据的来源、内容、质量以及用途等信
4、息提供一套规范描述,为科研人员、相关用户等提供高效的检索、获取、使用和评价服务,促进机械科学数据的保存、管理、交流、共享和维护。第4 部分:交换格式。旨在通过确立面向机械科学数据共享活动的、结构化和预定义的数据交换结构和格式,实现数据在采集、加工、汇交、分发、服务和应用等多个环节中的自动交换,从而推动和促进机械科学数据的高度共享。机械科学数据标准的四个部分分别规范了机械科学数据共享管理的四个方面,构成了一个有机整体,缺一不可。近年来,在机械行业的生产实践和科学研究中,我国机械科学领域积累了大量的科学数据。但是在机械科学数据共享活动中,由于没有统一的标准规范,同一领域的不同数据集、不同领域的相关
5、数据集的同一概念命名、定义、表达格式等数据描述经常出现不一致的现象,严重影响了机械科学数据资源的共享过程。为了确保机械科学数据共享与服务的实现,必须在数据的值域、语义和句法三个层面上,建立起用于表达机械科学数据及其关联数据的专用描述环境,主要是通过制定机械科学领域的数据元目录标准来实现。数据元是数据的基本单元,数据元标准就是对对象的属性进行一致性和精确性的规范标准,以便在跨系统过程中,通过定位、获取和交换,增加机械科学数据的可用性和共享性。本部分所选取的数据元按其特征分六大类:人员、机构、地址、联系方式类;日期、时间、期限类;数字资源描述与标识类;数字资源建设与管理类;数字资源间关系类;数字资
6、源背景类。为了方便浏览和查找数据元,按照数据元标记顺序和数据元名称汉语拼音顺序编制了数据元索引。本部分的制定,为实现机械科学数据共享提供了统一的数据元标准,推动和促进了机械科学数据的集成和共享。机械科学数据第2 部分:数据元目录G B T2 6 4 9 9 2 2 0 1 11 范围G B T2 6 4 9 9 的本部分规定了机械科学数据管理与共享过程中通用数据元的内容及表达表示。本部分适用于机械行业科学数据资源生产、数据库建设、数据信息交换与共享。2 规范性引用文件下列文件中的条款通过G B T2 6 4 9 9 的本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不
7、包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。G B T2 2 6 0-2 0 0 7 中华人民共和国行政区划代码G B2 3 1 21 9 8 0 信息交换用汉字编码字符集基本集G B T2 6 5 92 0 0 0 世界各国和地区名称代码(e q vI S O3 1 6 6 1:1 9 9 7)G B T4 8 8 0 2 2 0 0 0 语种名称代码第2 部分:3 字母代码(e q vI S O6 3 9-2:1 9 9 8)G B T7 4 0 8-2 0 0 5 数据元和交
8、换格式信息交换日期和时间表示法(I S O8 6 0 1:2 0 0 0,I D T)3 术语和定义下列术语和定义适用于G B T2 6 4 9 9 的本部分。3 1数据d a t a对事实、概念或指令的一种形式化的表示,适用于以人工或自动方式进行通信、解释或处理。3 2元数据m e t a d a t a关于数据的数据,是说明数据的来源、内容、格式、质量、状态及结构等特性的信息。3 3数据元d a t ae l e m e n t用一组属性描述其定义、标识、表示和允许值的数据单元。通常用于在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元。3 4数据元目录d a t ae
9、l e m e n td i r e c t o r y列出并定义了全部相关数据元的一种信息资源。注:数据元目录可以有不同层级例如,I S O I E C 委员会级、国际协会级、行业部门级、公司级、应用系统级。3 5数据元值d a t ae l e m e n tv a l u e允许值集合中的一个值。G B T2 6 4 9 9 2 2 01 13 6数据元值长度l e n g t ho fd a t ae l e m e n tv a l u e数据元值的字符数目。注:按A S C I I 字符数目计算数据元值的长度,一个汉字相当于两个字符。G B T1 5 1 9 1 一1 9 9 7,
10、定义1 3 1 1 3 7数据元值类型d a t a t y p eo fd a t ae l e m e n tv a l u e表示数据元值的不同值的集合。3 8数据集d a t a s e t可以标识的数据集合。注:数据集可以是一个或多个数据库或数据文件。3 9数据元标识符d a t ae l e m e n ti d e n t i f i e r由注册机构分配给数据元的标识符(一串字符或其他图形符号)。3 1 0数据元注册系统d a t ae l e m e n tr e g i s t r y由注册机构保存的用于描述数据元含义和表示形式的信息资源,包括注册标识符、定义、名称、值域、
11、元数据和管理属性等。4 数据元描述说明4 1 数据元属性本部分中,数据元是通过标识符、中文名称、英文名称、定义、表示、值域、同义名称和注释这些属性来表达和描述的,其中值域、同义名称和注释是可以根据需要进行选用的可选项。a)标识符:在一个注册机构内,由注册机构分配、与语言无关的数据元唯一标识符。(必选)b)中文名称:赋予数据元的单个或多个中文字词的指称。(必选)c)英文名称:赋予数据元的单个或多个英文字词的指称。(必选)d)定义:表达一个数据元的本质特性并使其区别于其他数据元的陈述。(必选)e)表示:数据元值的数据类型及字符长度的组合表示格式,见4 3。(必选)f)值域:根据相应属性中所规定的表
12、示形式、数据类型、数据格式、最大与最小长度而决定的数据元的允许值集合,该集合可以根据名称、引用来源、实例表达的枚举或者根据实例的生成规则来规定。(可选)g)同义名称:与给定名称有区别但表示相同数据元概念的单字词或多宇词名称。(可选)h)注释:对数据元的其他补充说明。(可选)4 2 数据元标识符分配在个注册机构的注册系统中,每个数据元都应该有一个唯一的数据标识符。通过注册机构标识符、数据标识符和版本标识符的组合,构成了数据元的唯一标识。本部分采用四位数字作为数据元标识符。其中,第1 位数字为数据元所属的组号,后3 位为顺序号。偶数标识符代表非代码型数据元,紧随其后的奇数标识符代表同义概念的代码型
13、数据元。如1 0 1 0代表非代码型数据元“资源创建者”,1 0 1 1 代表代码型数据元“资源创建者代码”。4 3 数据元值表示格式4 3 1 数据类型表示法本部分数据元值的数据类型采用表1 所示的方法表示。2表1 数据类型表示法G B T2 6 4 9 9 2 2 011表示符数据类型说明字符型可以包含汉字字符、字母字符、数字字符和其他字符等,应符合G B2 3 1 2 1 9 8 0 的S(s t r i n g)规定数值型N通过0 至9 的数字形式表达的值类型(n u m b e r)日期时间型通过Y Y Y Y M M D D、Y Y Y Y M M D D h h m m s s
14、的形式表达的值类型,应符合TG B T7 4 0 82 0 0 5 的规定,其中Y Y Y Y 表示年份,M M 表示月份,D D 表示日期,h h(d a t e t i m e)表示小时,m m 表示分钟,s s 表示秒,可以视实际情况组合使用4 3 2 宇符长度表示法本部分数据元值的字符长度采用表2 规定的方法表示。表2 宇符长度表示法示例分类表示方法(m、m l、m 2 等均为自然数)在数据类型表示符后直接给出字符长度的m:定长为m 个字符(字符集应符合G B2 3 1 2 固定长度数目1 9 8 0 的规定)可变长度不超过定义的最大字符数:在数据类型表示符后加“”后,再给出数据元最大
15、字符m:可爱长度,最大长度为m 个字符;数目;m 1 m 2:可变长度,最小长度m 1 个字符,最大可变长度可变长度在定义的最小和最大字符数之间:在长度m 2 个字符;数据类型表示符后给出最小字符长度数后加m l,m 2;最长m 1 个数字字符,小数点后m 2 位“”后,再给出最大字符数若干字符行按固定长度或可变长度的规定给出每行的字m l m 2:最多可占用m 2 行,每行最多m 1 个长度符长度数后加“”后,再给出最大行数不定长的数据单位4 3 3 值域表示方式值域是数据元允许值的集合,本部分中该集合可以通过以下几种方式给出:a)通过名称给出,即直接指出值域的名称。比如数据元“两字母国家代
16、码”的值域应采用G B T2 6 5 9-2 0 0 0 中规定的全部两字母代码。b)通过参考资料给出。比如数据元“产品条码”的值域是已经在物品编码中心注册的所有产品的条形码。c)通过枚举方式给出所有可能的取值以及每一个值对应的实例或含义。d)通过规则间接给出。比如数据元“无线电频率”的值域是从3k H z 到3 0 0G H z。e)无要求。4 4 数据元目录格式数据元目录是数据元标准的核心内容,本部分在格式上有如下约定:a)为节省版面,将数据元的标识符、中文名称和英文名称放在一行中。b)标识符之间留有空位,以便扩充。但是针对同一数据元概念的名称和代码型数据元,应分配两个连续的标识符。c)数据元和数据元之间用一条实线分割开,使读者阅读得更加方便和清晰。G B T2 6 4 9 9 2 2 0 1 15 数据元的类目分组使用本部分给用户提供方便,将数据元按自然属性分为9 个类目,同时为国家和部门的使用保留了足够的空间,如下:第1 组:(1 0 0 0 1 3 1 2)人员、机构、地址、联系方式;第2 组:(2 0 0 0 2 0 9 8)日期、时间、期限;第3 组:(3 0 0 03