1、第 卷 第期 年月钢铁 ,:超高强钢的基因组数据库管理平台建设及应用雍兮,刘振宝,王长军,宁静(钢铁研究总院有限公司特殊钢研究院,北京 )摘要:“材料基因组计划”主要是为了改变材料研究的“试错”模式,通过对以往试验数据的收集与整理,结合模拟计算技术、大数据与区块链等信息技术,建立材料的基础数据库、大数据管理平台、高通量模拟计算、试验与分析平台,并利用机器学习等先进人工智能技术,为能够快速开发高性能新材料提供有效的数据支撑。主要针对超高强钢研发中的数据处理需求,依托超高强钢的基础数据收集、超高强钢高通量模拟计算等,探索建立了超高强钢的基因组数据库及其管理平台,提出了数据库系统的结构框架以及基因组
2、数据管理平台的总体架构,并展示了在该数据平台基础上进一步开发的试验数据汇总生成试验报告、计算数据解析及可视化展示等应用功能。该平台可以支持数值、文本、富文本、表格、函数、图片等丰富的数据类型,支持 级海量数据的存储管理以及百万级数据记录的索引与检索,实现所有数据从在线采集、规范化处理、存储和管理到检索和分析的全流程高效智能化管理,从而为超高强钢基因组材料研发工作的顺利进行提供了必要的数据保障,有效提升了研究团队的数据资源化能力和数据分析能力,通过一个能够快速索引、检索并给出分析报告的数据管理分析平台,为研究部门开发新型超高强度钢提供优质服务。关键词:材料数据管理平台;材料基因组数据库;高通量计
3、算;材料大数据;超高强度钢文献标志码:文章编号:(),(,):,:;作者简介:雍兮(),女,博士,工程师;:;收稿日期:制造业是国家经济命脉的基石,制造业的发展离不开新材料的发展。美国奥巴马政府于 年第期雍兮,等:超高强钢的基因组数据库管理平台建设及应用推出了“材料基因组计划”,目的是为了满足制造业对高性能新材料的需求。美国希望通过该计划,改变材料研究的“试错”模式,通过对以往试验数据的收集与整理,结合模拟计算技术、大数据与区块链等信息技术,建立材料的基础数据库、大数据管理平台、高通量试验平台,最终为快速开发高性能新材料提供有效的数据支撑,从而缩短高性能新材料的研究周期。因此,材料基因组工程关
4、键在于基础数据库的建立,无论目前采用的是高通量模拟计算、高通量试验、高通量分析检测技术,都是为了降低模拟、试验、分析检测的误差,获得准确的材料基因基础数据,建立准确的材料基因数据库。随着近几年材料基因组计划项目的实施,通过高通量试验、高通量模拟计算、高通量分析都会产生大量的数据,对于这些数据的记录、处理与分析已成为特别紧迫的任务,特别是带有数据挖掘、数据学习、数据对比、数据处理与分析功能的人工智能管理平台逐渐成为了最有竞争力的材料基因组数据管理平台 。超高强钢具备优异的综合性能,在航空航天和能源电力等领域中得到了广泛的应用 。本单位在超高强钢研究方面积累了大量的基础数据,但在超高强钢的数据积累
5、和挖掘、数据管理平台的建立等方面还有待于进一步突破。为此,本文在借鉴相关数据管理平台建设经验的基础上,研究建立了一个超高强钢的基因组数据库管理平台,为促进本单位超高强钢的研发工作提供了优质的数据存储与查询检索服务,并对该基因组数据库的本体架构进行了初步的探索和分析,可以为国内材料基因组领域的相关工作提供一定的借鉴和参考。超高强钢材料基因组数据库系统结构框架的建立通过把知识工程中的本体论思想引入到超高强钢领域,并借鉴和参考了“信息与文献 都柏林核心元数据元素集”、国家科技图书文献中心 文献资源加工规范 和科技文献书目本体()等现有国内外著名的标准规范,从数据应用的角度整合梳理了超高强钢领域知识体
6、系,并利用元数据模型对领域中的概念、属性以及它们之间的联系进行清晰的定义和规范化的表示(数据定义见表和表),形成了超高强钢专用数据库数据规范,从而能够以统一的标准和格式对超高强钢的各类数据进行存储和管理。表“试验报告”通用容器定义示例 序号名称标识符数据类型频次范围最大长度备注报告编号 字符串,检测单位 文本,委托单位 文本,试样数量 整数,所属钢种 字符串,所属炉号 字符串,试验标准 文本,试验设备 文本,检验时间 日期,报告原件 文件,支持多种文件类型在属性与标准定义基础上,以超高强钢试验数据、模拟计算数据、产品数据和参考文献数据为模块组成,搭建了超高强钢全局数据库的系统结构框架,如图所示
7、。在图中,试验数据库主要用于存储研究人员进行的各类试验的试样原始数据和汇总生成的试验报告;计算数据库则用于保存研究人员每一次计算过程的输入参数和输出结果,目前可以处理的专业数据包括第一性原理计算软件 和热力学计算软件 的输入输出数据;产品数据库中的数据资源包括本单位各种产品的性能数据、质保书数据、技术条件和合同数据等产品相关信息,用于保障各项生产经营活动都做到有据可查;参考数据库中的数据则包括由研究人员整理收录的图书文钢铁第 卷表元数据“所属钢种”定义示例 项目数据值名称所属钢种标识符 出处超高强钢专用数据库数据规范定义一种钢材的通用标识或代号频次范围,最大长度 描述规则用来代表一种钢材的标识
8、或代号,如 数据样例 献数据、会议资料和手册数据等,以及由外部数据提供方提供的材料牌号、显微组织、性能、合金相图等数据。超高强钢基因组数据管理平台的总体架构建立超高强钢的基因组数据管理平台的目的是为中国超高强钢的发展提供材料基因数据的有效支持与优质服务,因此,该平台的功能架构应包含数据解析与存储的处理功能、数据检索与查询的服务功能、以及数据分析与对比的展示功能等。基于此思想,建立了超高强钢基因组数据管理平台的总体架构,如图所示。图超高强钢全局数据库的系统结构框架 图超高强钢基因组数据管理平台的总体架构 由图可知,超高强钢基因组数据管理平台在应用层面主要由部分组成:数据管理系统、数据应用系统和数
9、据分析系统。其中数据管理系统提供对整个平台的综合管控和数据库系统管理功能,数据第期雍兮,等:超高强钢的基因组数据库管理平台建设及应用应用系统则涵盖从数据采集、浏览、检索到展示等各类用户需要使用的数据库服务功能,而数据分析系统则用于对用户所关心的数据进行各类统计和对比分析,以便领域专家利用分析结果进行材料优化设计,对研究部门开发新型超高强钢提供有力的数据支持。由此出发,平台的具体实现采用了广泛应用于企业级软件开发的 架构和规范的解决方案,可以有效提高系统设计与实现的效率以及系统动态交互能力;平台的运行采用了 架构,可以有效减轻客户端的运行压力和软件维护压力;平台的数据搜索则采用企业级搜索引擎 方
10、案,可以提供专业数据的索引建立和搜索访问功能;同 时 平 台 还 采 用 了 基 于 和 技术的用户权限管理和检测控制,确保整个平台的数据安全。超高强钢基因组数据管理平台的应用拓展在该数据管理平台的基础上,针对本单位超高强钢试验数据和计算数据的使用特点,一方面开发了试验原始数据批量采集入库和自动汇总生成试验报告,以及多种类型试验报告自动汇总生成对应产品质保书的数据处理功能,另一方面完成了典型计算软件 和 与平台之间的数据对接,实现了高通量计算数据的自动导入功能,从而有效减轻了相关技术人员的工作量并大大提高了各类数据的可追溯性。例如图所示为拉伸试验原始数据汇总生成试验报告的过程,图所示为 软件数
11、据导入和展示页面示例。图拉伸试验报告生成示例 图 软件数据导入及展示示例 不同于通常的固定结构的数据库管理平台,超高强钢基因组数据管理平台设计为能实现可灵活配置和修改数据库结构的数据库管理系统功能,今后可以方便地根据实际科研业务需要进行扩展,以持续应对大数据时代对于现代材料研发过程的新增管理应用需求。由此设计的数据库管理系统由数据系统、数据表和数据记录个层级的数据容器构成,一个数据系统包含多个数据表,一个数据表包含多条数据记录。数据系统用于组织不同领域的多个数据表之间的层级关系,而数据表定义了同一类数据记钢铁第 卷录的字段属性结构,数据记录则用相应数据表定义的字段结构来存储各个数据实体多个维度
12、的信息。数据库管理系统提供对高强钢专用数据库中可使用的各类数据系统和数据表的详细配置服务,支持用户根据自己的需求灵活配置各种组成的数据系统和各种类型的数据表。总结与展望本文以材料基因组计划为契机,在建立数据处理标准和规范的基础上,搭建了超高强钢基因组数据库及其管理平台。文章展示了基因组数据库系统结构框架和数据管理平台的总体架构,以及数据处理及定制化呈现的结果。该数据管理平台的优势在于面向用户基本处于开放状态,有利于研究人员能够及时收集、汇总和存储各类数据信息,并在此基础上进行数据对比与分析,从而快速得出所研发的新型超高强钢的各项性能趋势,为研究人员判断所研发超高强钢的综合性能提供了有效的数据支
13、撑。总之,超高强钢基因组数据管理平台,是一个面向用户友好开放的平台,能够为研究人员开发新型超高强钢提供有力的数据支持,也为其他材料基因组数据管理平台的建设提供了一定的思路。参考文献:李波,杜勇,邱联昌,等浅谈集成计算材料工程和材料基因工程:思想及实践中国材料进展,():(,:,():)王卓,杨小渝,郑宇飞,等材料基因组框架下的材料集成设计及信 息 平 台 初 探 科 学 通 报,():(,():)何鹏,林盼盼基于材料基因组理念的钎焊材料开发与智能钎焊技术创新系统工程材料导报,():(,:,():)杨小渝,任杰,王娟,等基于材料基因组计划的计算和数据方法 科 技 导 报,():(,():)肖睿娟
14、,李泓,陈立泉基于材料基因组方法的锂电池新材料开发物理学报,():(,():),():,():贾兴祺,李伟,许元涛,等基于增材制造的钢铁块体材料高通量实验方法上海金属,():(,():),():范晓丽材料基因组计划与第一性原理高通量计算中国材料进 展,():(,():),:,:任子平,李德刚,李晓伟,等钢铁企业大数据研发平台的建设与思考钢铁研究学报,():(,():)张福明智能化钢铁制造流程信息物理系统的设计研究钢铁,():(,():)刘玠人工智能推动冶金工业变革钢铁,():(,():),:李姿昕,张能,熊斌,等材料科学数据库在材料研发中的应用与展望数据与计算发展前沿,():(,:,():)李
15、建军钢铁企业大数据平台的开发及应用自动化应用,():(,():)(下转第 页)第期张琦,等:典型钢铁制造流程碳排放及碳中和实施路径 :,()国家工信部工业和信息化部等六部门关于印发工业能效提升行动计划的通知 :(:)徐向阳,任明,高俊莲京津冀地区钢铁行业节能和 减排的技术路径生态经济,():(,():)胡建红,蔺文涛,杨源满恒壁温焦炉上升管荒煤气余热回收技术应用冶金能源,():(,():)张琦,王小壮,许立松,等钢铁流程资源能源碳排放耦合关系及 分 析 钢 铁,():(,():)张琦,沈佳林,许立松中国钢铁工业碳达峰及低碳转型路径钢铁,():(,():)李茂权钢铁企业界面优化的节能和效益分析冶
16、金管理,():(,():)季书民八钢低碳冶金技术路径研究及实践探讨新疆钢铁,():(,():)于恒,周继程,郦秀萍,等气基竖炉直接还原炼铁流程重构优化中国冶金,():(,():)世界金属导报浦项钢铁公司低碳发展路径研究 :(:),:贾林海多措并举 推 动 绿 色 低 碳 发 展中国 冶 金 报,()(,()张琦,向婷,田硕硕钢铁化工联产系统构建及未来发展趋势 钢铁研究 学报 :(,:)王国栋,储满生低碳减排的绿色钢铁冶金技术科技导报,():(,():),?,:,:李洪福钢铁制造流程系统节能理论与方法的探讨及应用实践冶金能源,():(,():檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵檵)(上接第 页)吕庆,刘颂,刘小杰,等基于大数据技术的烧结全产线质量智能控制 系 统 钢铁,():(,():)赵先存,宋为顺,杨志勇,等高强度超高强度不锈钢北京:冶金工业出版社,(,:,)钟锦岩,李进,钟平超高强度不锈钢的性能及应用北京:化 学 工 业 出 版 社,(,:,)