1、 理 论 探 讨50档案管理1/2023总第260期目前,对工程电子文件和工程电子文件本体数据这两个概念的认识还存在界限划分不明问题。在实践层面也存在没有基于全生命周期原理,形成整体本体数据融合方案,也没有将数据的应用和数据来源环境、方案与方法、人员等要素进行有机融合。对此,需要基于业务、立足标准、面向实际、利用技术,开展工程电子文件全生命周期本体空间动态数据融合构建机制研究。1 工程电子文件与本体数据的概念辨析工程电子文件和本体数据混淆不清,广泛存在于工程设计人员、施工人员、验收人员、工程档案管理员、项目资料员工作中,甚至部分学者在学术研究中,也常常忽略。电子文件的概念,冯慧玲教授在诸多专著
2、和教材中,已阐述清楚,并被广为认知、认可。国家标准电子文件归档与管理规范中,也有专门的定义,虽适用标准为“党政机关产生的电子文件”,然其定义中的形成、形式、载体、作用和环境,可为工程电子文件本体数据辨析提供清晰思路和结构框架。电子文件本体数据与原生电子档案、原生数字文件,或许也有瓜葛与关联,但论文无意去探讨概念,更多的是从工程实践的角度去探讨和辨析。工程电子文件和本体数据区别有二:(1)直接使用性:此角度是区分工程电子文件与本体数据的基本属性。在使用过程中,工程电子文件可直接使用,作为使用依据,无需对工程电子文件的内容进行再分析。而本体数据的使用,则需根据需求,进行加工,动态使用。纵然是清洗、
3、加工之后的本体数据,也不能直接使用,一旦变成固态模式、可直接参考,则就变成了电子文件。(2)客观反映性:工程电子文件本体数据是在工程全生命周期过程中产生的第一手数据,对其清洗和加工,只是去芜存菁,选取精度更高、效果更佳的本体数据,只是为了更好的应用,但不会也不允许对本体数据的内容进行更改。因此,能够客观的反映工程活动的历史面貌尤其是历史原貌,而电子文件是对工程活动历史原貌的逻辑体现。工程电子文件和本体数据联系有二:(1)本体数据是电子文件形成的参考依据。不论是设计图纸、施工工艺文档还是竣工图纸与验收文件,都是在参考文本数据的基础上形成的。例如,设计图纸时要考虑风向水文、地貌地形等本体数据,施工
4、工艺文档要参考历史施工本体数据。(2)电子文件是本体数据融合的原则和指导。工程数据很多,哪些可以是本体数据,哪些只能是数据,主要看是否符合电子文件的需求,也就是输出决定输入,使用决定融合。为确保使用无错,各智慧应用前瞻,应充分建立在电子文件的基础上,工程电子文件全生命周期本体空间动态数据融合构建机制研究*付永华,张文欣,张 策,刘 茹,杜妍枢摘 要:工程电子文件本体空间动态数据是智慧应用与前瞻的基础,过程复杂、多源异构,故需面向全生命周期,研究融合构建机制,形成融合模型。从工程角度出发,梳理工程电子文件本体空间动态数据的研究与实践范围,从本体数据需求、来源、对象和方式四视角,梳理融合构建机制研
5、究;立足全生命周期的智慧前瞻;调研工程实例,构建融合环境、项目、方法、需求、人员、设备等六要素驱动的问题分析;结合应用需求,以自寻、自采、自修和自管为原则,构建本体空间动态数据融合模型,给出软硬件设计方案。形成智慧应用四前瞻:工程模拟、实时分析、工程溯源、多模感知和多态演绎;提出本体空间动态数据融合构建四模式:最优融合、多角融合、协同融合和纠复融合。经实证,可有效拓展应用空间,产生经济与社会价值,促进数字转型。关键词:本体数据;空间动态融合;工程电子文件;构建机制Abstract:The spatial dynamic data of engineering electronic record
6、s ontology is the basis of intelligent application and foresight.The process of it is complex,multisource and heterogeneous,so it is necessary to study the fusion construction mechanism and form a fusion model facing the full life cycle.From the perspective of engineering,we sort out the research an
7、d practice scope of ontology spatial dynamic data of engineering electronic records,and sort out the research of fusion construction mechanism from the perspective of ontology data demand,source,object and method;offer intelligent forward-looking proposals based on the whole life cycle;investigate p
8、roject examples and build a problem map driven by six elements,including environment,project,method,demand,personnel and equipment.To meet the requirements of the application,we construct the ontology space dynamic data fusion model based on the principles of self-searching,self-mining,self-repair a
9、nd self-management,and give the software and hardware design scheme.We propose four perspectives of intelligent application:engineering simulation,real-time analysis,engineering traceability,multi-mode perception and polymorphism deduction.Also,four models of ontology space dynamic data fusion const
10、ruction:optimal fusion,multi angle fusion,collaborative fusion and correction of repeated fusion.Through demonstration,they can effectively expand application space,generate economic and social value and promote digital transformation.Keywords:Ontology data;Spatial dynamic fusion;Engineering electro
11、nic records;Construction mechanismDOI:10.15950/ki.1005-9458.2023.01.038档案管理投稿信箱: 理 论 探 讨5档案管理1/2023总第260期不能把电子文件抛开。根据区别与联系,可以从理论角度,给出工程电子文件本体空间数据动态融合模型,如图1所示。图1 工程电子文件本体空间数据动态融合模型通过上述分析,可以看出全生命周期本体空间动态数据融合构建有利于背景数据、实体数据生成的全过程关联控制、流程控制、回溯控制和有效利用。此方面已有专家开展研究,如:穆勇(2022)等综合了建筑效果、专家意见,对某更新工程进行了设计方面的回溯1;吴
12、冬(2022)等研究在施工过程中,进行质量实时分析,及时发现施工失误、设计失误,第一时间预警2;Claudio Favi(2019)等,利用工程本体数据,构建面向全生命周期的数据框架,为整体管理提供支持3;夏翠娟(2022)等,认为其是数智时代,构建社会记忆的多重证据。42 本体空间动态数据融合研究与应用模型2.1 融合研究。工程电子文件全生命周期本体空间动态数据融合研究关注点有四:全生命周期融合需求、融合来源、融合对象和融合模式。全生命周期融合需求的研究,重点在于形态和语义的融合,如钱毅(2022)归纳了档案从数字化到数据化、从语义化到故事化的全链路业务轨迹,总结档案资源形态在不同态别之间的
13、跃迁5。其余研究,基本没有从全生命周期的角度,考虑本体数据的融合。本体空间动态数据融合来源,主要有三:网络来源、业务系统、手操业务开展。当前,面向网络的数据融合,已经成为研究热点,包括互联网平台和智能终端的平台。业务系统包括在线系统、局域网系统和单机系统,单机系统或受限于条件,更多是安全方面的考虑。某些手操业务的开展,也可能产生本体数据,一般为某项业务提供支持,虽然数量不多,但可能具有代表性和针对性。图纸、公文、网站页面是本体空间动态数据融合的主要对象,通过下载或截图的方式,或者直接以原格式融合,或者转换为pdf格式或图片格式。业务数据也逐渐成为融合的主要构成,载体以图片、视频类为主,甚至面向
14、工程项目的探讨、交流,也作为融合的对象。从融合模式来看,通过“爬虫技术”,实现本体数据的“自动增量”6,是当前研究的热点。在面向业务系统时,部分研究考虑到了融合时的筛选和标注,已经融入了一定的加工流程。基于信息抽取,利用可视化技术,对本体数据进行融合,保障了融合的质量,丰富了未来的应用。知识图谱技术,也被运用到工程图纸本体数据的融合中,通过“知识识别粒度、知识多维关联度以及知识融合与利用程度”等方面的研究,实现了智能化的分类。72.2 智慧应用模型面向工程全生命周期管理,以本体空间动态数据为主,融合其他相关数据,与智慧应用关系模型如图2所示。图2 全生命周期本体动态数据与智慧应用关系模型该关系
15、模型具有前瞻可控、连续改进、质量溯源、多模感知等功能。前瞻可控方面,主要包含设计类、以往施工类本体动态数据,设计类本体动态数据为工程模型的建设提供原始数据,通过计算,模拟未来施工的情况;以往施工类,则主要起到预警的作用,体现曾经出现的设计与施工之间衔接出现的问题。另外,地理、水文类本体动态数据,也将为工程模拟提供支持,达到接近式仿真效果。而模型的可控功能,则模拟出最佳施工效果,提前倒逼设计优化,从而实现尚未施工,胸有成“工”的效果。连续改进方面,以工程材料和施工过程本体动态数据为支撑,结合历史施工问题库和重点施工环节库,通过流程分析、特征识别技术,对正在开展的施工进行实时分析。发现的问题,以及
16、整改的过程,也可以作为本体空间动态数据,进入到整改库中,包括将来的整改评估报告等。质量溯源方面,对于建筑工程项目来说,溯源非常重要,因为建筑工程项目,一旦出现问题,就可能是事故,就可能导致巨大的经济损失甚至生命损失8。因此,采用多维溯源机制,构建可借鉴、可预见和可视化的溯源模型就非常关键。多模感知方面,基于本体空间动态数据,利用视觉感知、听觉感知、触觉感知、生理信号感知等多模态感知方式,以多种形态,演绎工程生命周期,更可以在行业精神建设、企业文化塑造、产教融合智慧教学、沉浸式员工实践培训、城市记忆塑造、建筑知识科学普及等方面,提高理解速度,加深感知印象,实现深度记忆。3 本体空间动态数据融合问题分析3.1 融合问题调研过程。本研究选择以郑州市地下综合管廊惠济项目、瑞佳路跨贾鲁河大桥项目为主要调研对象,其他六处国内大型工程为辅助调研对象。调研内容包括环境、项目、方法、需求、对象、人员等六要素。调研方法为实地考察、过程跟踪、本体空间动态数据主题分析、个人访谈 理 论 探 讨52档案管理1/2023总第260期等。调研时间为2022年3月到2022年6月共4个月的时间。3.2 本体空间动态数