1、信息通信基于云计算的医疗数据共享平台构建刘楚菲,刘宇辰*(长春中医药大学医药信息学院,吉林长春130 117)摘要:为降低医疗数据在共享中的丢失量,引进云计算技术,对医疗数据共享平台的构建展开了研究。参照基于中央索引的分布式区域划分方式,设计数据共享平台架构;选用Web应用服务器、TL-NR810-8C-S型号的安全网关作为共享平台主要硬件设备;引进云计算技术,驱动平台云端数据存储模块中的智能清洁程序,将采集的原始医疗数据输入到预处理模块中,设计医疗数据清洗与属性约简处理;使用MySQL,构建医疗数据资源库;初始化处理医疗数据集合,生成传输过程中的区块链共识模块,设计医疗数据安全传输与共享。试
2、验结果证明:开发的基于云计算技术的共享平台,可以在提高医疗数据交互共享效率的同时,降低共享过程中数据的丢失量,有效提高了医疗信息化建设水平。关键词:云计算;安全传输;共享平台;数据库;属性约简;医疗数据中图分类号:TP311.132023年第0 5期(总第 2 45 期)文献标识码:A文章编号:2 0 9 6-9 7 59(2 0 2 3)0 5-0 12 1-0 30引言随着新一轮医改的持续化推进,医疗信息化建设已成为产业发展的一个重要支柱。因此,实现医院信息化平台的建设,是保障社会医疗服务机构创新发展的重要举措。在深入市场的调研中发现,当前医疗机构仍存在看病难、药品价格高等突出问题,此方面
3、问题已经严重制约了医疗服务体系的发展,导致医院的公益性和服务性职能无法得到充分发挥2 。提高地区医疗质量,充分发挥区域医疗服务的作用,必须通过建立区域医疗信息系统,有效地运用高新技术,解决目前行业发展存在的突出问题。近年来,“云计算技术”作为一种新兴、前沿、高端的网络技术,在各个领域内迅速发展,此项技术主要利用网络提供的动态、可扩充、可虚拟资源,实现信息、数据、资源的迅速传递和分享。目前,此项技术已被应用到机械工程、工程生产、数字化教学等多个工作领域3。本文在此次研究中,引进云计算技术,开发可实现医疗数据共享的全新数字化平台,旨在通过此次设计,推进国内医疗服务体系的高质量、高水平建设。1数据共
4、享平台架构本文设计了一个基于中央索引的分布式区域医疗信息共享平台,此平台集成了云计算技术、物联网技术、SOA技术、Web服务技术、虚拟化技术等现代化技术,此种结构的平台由于集中索引方式不需要CPU和内存作为支撑,其运行具有较高的稳定性、可靠性。参照上述提出内容,设计数据共享平台架构,如图1所示。固定工作站与移动终端模块服务模块服务接口服务注册资源查找信息交流专线网络资源模块数据共享安全网关从图1中可以看出,此平台由4个主要模块构成,分别为移动终端模块、服务模块、资源与事务管理模块。其中移动终端模块中集成了医疗机构中多个部门与诊室的移动通信设备,在无线传输网络的支撑下,实现对资源的高效率传输。资
5、源模块中主要包括物理资源与虚拟资源,前者包括计算机资源、设备存储资源、数据库资源等,后者为云计算技术集成的核心模块,包括诊疗数据、患者数据等医疗数据。资源与事务管理模块包括医疗数据的应用监控、就诊用户信息的隐私管理、任务管理、安全管理等,主要作用是通过云技术来实现对资源层事物管理模块资源管理模块数据共享数据共享安全网关安全网关图1数据共享平台架构收稿日期:2 0 2 3-0 1-13作者简介:刘楚菲(2 0 0 2-),女,广东惠州人,本科在读,研究方向:医学信息工程。通讯作者:刘宇辰(19 9 4-),男,吉林长春人,硕士,助教,研究方向:中医药数据分析与处理。+.+4李梦雪,张子扬,邓君,
6、等.基于logistic回归模型的我国数的设备状态监测与智能诊断平台的应用J.电力大数据,字X射线摄影设备状态检测初检合格率影响因素分析.2022,25(09):61-67.中华放射医学与防护杂志,2 0 2 2,42(10):7 8 7-7 9 2.8岳健国,郭瑞,傅行军,等.改进因果推断方法在发电机组辅5张雷,温建民,王天兵,等.基于多源数据的牵引供电设备故机状态监测中的应用研究J.风机技术,2 0 2 2,6 4(0 4):7 4-8 0.障预测与健康运行维护管理平台.电力信息与通信技术,9齐鹤,祁潇楠,程亮,等.高速铁路ATP车载设备健康状态2022,20(06):104-114.监测
7、及智能诊断系统研究J.铁路计算机应用,2 0 2 2,31(0 8):6 王立峰,马超,牛永光,等.基于大数据背景下电站设备状态监测及故障检修管理系统仿真设计J.粘接,2 0 2 2,49(10):176-179.7房何,杨强,管玉峰,等.田湾核电站基于边缘计算与大数据12122-26.10朱江丽.机电一体化技术在智能制造中的应用.南方农机,2 0 2 2,53(2 1):148-150.Changjiang Information&Communications控制资源的集成。2硬件设备选型2.1服务器选用Web应用服务器作为平台设计的主要硬件设备,此服务器是云计算共享服务平台的管理、控制和通
8、信服务的重要组成部分6 。集成服务器后,网络终端可以通过接受用户的询问,向网络服务的医疗单位提出请求,对XML文档数据进行译码,并将解译结果以Web页面的形式返回7 。服务器为机架式超聚变服务器的MicrosoftWindowsServer版本,其电源为9 0 0 W,磁盘阵列为RAID0,1,5,10,磁盘转速为10K/10K,C PU 为52 18 R(2.1G H z/2 0-C o r e/2 7.5M B),接为SASSATA,扩展槽为Pcie,重量为2 0.5kg,内存类型为DDR4,二级缓存容量为2.1GHz/20-Core/27.5MB/125W。以此对共享平台服务器进行选型,
9、完成对平台硬件设备的设计。2.2安全网关安全网关的主要作用是集成医院各个部门的信息、数据,Web服务器在安全网络关闭后开始运行,通过此种方式,可以实现基于SOA的不同类型医疗数据的整合。为实现数据的互用性,将医疗数据用XML格式表示,以DICOM3、CDA、HL7 等为基础,从不同的移动终端采集数据18 。在传输时,采用RSA-2048比特加密对XML文件与数据进行加密,以保证数据在传输中安全稳定运行。总之,数据网关是数据安全传输与数据存储的接口,也是共享平台设计与开发的关键9。为满足平台设计需求,按照下述表1,设计安全网关的选型。表1安全网关选型序号项目(1)万兆SFP+端口(2)产品尺寸(
10、3)存储温度(4)千兆SFP端口(Combo)(5)输入电源(6)工作湿度(7)型号(8)千兆RJ45口(9)安全过滤带宽(10)最大吞吐量(11)用户数限制数集成安全网关前,需要根据平台运行的具体参数与实际需求,对安全网关运行参数进行调试,以此种方式,完成对安全网关的选型。3基于云计算的医疗数据清洗与属性约简处理引进云计算技术,设计医疗数据的清洗与属性约简处理。在此过程中,启动平台云端数据存储模块中的智能清洁程序,将采集的原始医疗数据输入到预处理模块中,初始数据由云计算终端进行初审,审核通过后,再将海量数据导入到云存储中。在数据导入后,平台需要在云计算模块上对原始数据进行聚类分析,以实现对异
11、常风险数据的识别。设定云存储模块中两个数据实体表示为A与B,计算A与B之间的实体结构刘楚菲等:基于云计算的医疗数据共享平台构建相似度,计算公式如下。GAn=|4nB/4UBl公式(1)中:GAB为A与B间的实体结构相似度。4医疗数据资源库构建使用MySQL,构建医疗数据资源库。在此过程中,操作计算机界面,选择“文件”菜单栏中的“新建”指令,在“Microsoft访问”窗口右侧将出现一个“新文件”子对话框。在“新建”子对话框中点击下拉菜单栏中的“空白资料库”项目,弹出“新档案资料库”对话框。将资料库命名为“FirstAccessDB”。在此基础上,点击“Create”按钮,创建一个空白“我的第一
12、个访问”数据库。此时,操作界面将弹出一个对话框,用于管理录入的医疗数据。根据创建的表格名称,录入医疗数据,生成医疗数据资源表。如下表2 所示。表2 医疗数据资源表结构序号字段名(1)Patient number(2)Name of patient(3)Patient personal information(4)Medical insurancemanual number(5)Medical record number(6)Admission number(7)Type oftreatment(8)Diagnosis and treatment results(9)按照上述方式,建立医疗数据资
13、源库中的其他信息表,将数据表集成在平台资源模块中,完成医疗数据资源库的构建。5医疗数据安全传输与共享参数驱动大数据共享算法,初始化处理医疗数据集合,生成传4个输过程中的区块链共识模块,识别数据是否访问传输链路规440mm420mm44mm则,如果输出结果为“N”,则需要反馈数据进行共识链的二次生成,如果输出结果为“Y”,则需要跳转到下一步骤,获得数据-40 7 0 包的解密密钥,通过对节点的解密,实现对医疗数据的共享传2个输。共享过程中,可假设数据包中包含的用户属性集合信息100240VAC,50/60Hz为R,则R中包含rirzrsr4等若干数据。在已知隐私数据的基础10%90%RH不凝结上
14、,设定医疗数据包的公私钥,利用Hash函数,生成数据包在TL-NR810-8C-S传输中的主密钥,计算公式如下所示。6个k=h(K/R)100MB公式(2)中:k为数据包在传输中的主密钥;h为Hash函2Gbps数;K为私钥。在此基础上,根据传输过程中区块共识节点的500700分布,设计数据包的安全传输过程,计算公式如下所示。公式(3)中:P为数据包的安全传输过程;N为安全随机数;T为一个共享周期;n为共享目标值;f为传输节点总数;i为第i个数据包。共享过程中,向节点发送请求信息,上交前端身份属性集合信息,通过此种方式,实现对节点数据的安全共享与传输。6对比实验为实现此平台在实际应用中对医疗数
15、据共享效果的检验,以某地区大型医疗服务机构为试点单位,选用此医疗机构某公开数据集合作为此次实验的样本数据,采用设计对比实验的方式,对该系统进行测试。在其数据管理终端搭建测试环境,资源池同时连接着计算机服务器和存储服务器,另外,通122(1)表头名称数据类型诊疗患者编号Int就诊患者姓名String患者个人信息String医保手册编号Int病历号String住院号String就诊类型String诊疗结果StringOther其他P=NxT/n(f)String(2)(3)Changjiang Information&Communications过资源池对Web服务器、软件以及网络带宽进行匹配应用
16、。为给此平台提供一个相对良好、稳定、适配的运行环境,部署数据共享平台接口功能:GE-Ttext用于列举平台任务,CREATE接口用于创建任务,DEL接口用于暂停运行,POST接口用于数据上传,DELJ接口用于终止运行。据此调试终端硬件设备参数,进行测试环境技术参数的设计,使用Corei7处理器、RAM为18、ROM为4GB、5.1.7 版本的Hadoop、宽带 10 0 0 Mb、计算机系统为Windows10、Sp a r k 版本为3.5.6 版本、CPU为4核、云磁盘/外设硬件 10 0 GB。引进基于MapReduce的数据共享平台,与基于大数据技术的数据共享平台,将其作为对照组平台1与对照组平台2,使用本文开发的平台与对照组平台,对医疗数据进行共享传输。在排除外界条件与测试环境干扰的条件下,逐步增加共享平台登录人数参数医疗数据的共享,对共享过程中三个平台数据交互终端的并发行为发生次数进行统计。结果如下图2所示。70一()/605040302010从上述图2 中可以看出,在相同的条件下,本文设计的平台在共享医疗数据过程中的共享行为并发次数较高,而对照组平台1与对照组平台2 在共