1、基于知识图谱的人员关系构建王掀李鑫:本文基于知识图谱通过节点定义、边关系处理以及规那么集搭建来实现人员关系可视化,实现人员间显性和隐形关系的挖掘,为公共平安领域决策提供技术支撑。关键词知识图谱 实体 共词近年来随着人工智能技术的蓬勃开展,知识表示技术作为人工智能的一个重要组成局部也得到了广泛开展和应用,其中知识图谱尤为突出,它用可视化技术描述实体间的潜在关联关系。知识图谱是描述客观世界中的实体、概念、事件、属性以及这些因素之间的联系。其中实体和概念用于指代客观世界中的具体事物,包括地点、人物、国家和产品等。实体与实体间以某种形式被联系在一起,其联系在知识图谱中以谓词形式表达出来。目前已有大量的
2、科研机构和学者致力于知识图谱的相关研究,国内知识图谱工程有中文图谱资源库OpenKG、百度知心和知立方等。这些知识图谱就是要为数据之间潜在关系的预测提供关键技术支撑,从而挖掘有用信息。1 知识图谱的人员关系构建本文人员关系构建作为一种基于图的数据结构,它由节点实体和边关系组成,每个节点代表一個实体,每条边为实体与实体之间的关系,把与社会网络有关的所有数据都打通,构建包含多数据源的人员关系图谱。在构建过程中,需要通过节点定义、边关系处理以及规那么集搭建来实现人员关系的可视化。1.1 定义实体节点节点即为实体数据,如客户的ID,号,微信,邮箱,QQ等,一般用户ID我们认为是业务的核心顶点。可利用任
3、意节点拓展用户所有信息。同时可以建立双节点关联,实现节点间的关系查询。1.2 边关系处理边关系用来描述两节点间边的属性内容。如在使用设备信息时,用户可能有、注册、转账等不同行为属性,也有呼入呼出等不同的行为属性,在处理边关系时,我们参加属性描述能更有效地识别用户行为轨迹和关联关系。1.3 规那么集搭建有了节点和关系,我们就构建了根底的关系网络,但这样的网络并不能直接将我们所关注的核心业务信息展示使用,这时规那么集的搭建就显的格外重要。如使用号关联,IP关联,邮箱关联,通讯录重合度关联等,将节点间的关联关系聚集,形成聚集关联,直接用于查询,快速搜索公共平安相关信息。其中,涉及到实体层次关系及关联
4、关系的计算和共词的关系计算。对于实体中词之间的关系,主要是计算词之间的层次关系和关联关系,层次关系揭示词之间的上下位关系,关联关系揭示词之间的语义相关性,甚至关联的属性。词之间的共现关系中的共现词频本身就可以表达共词关联度,目前已有多种计算共词关系强度的算法,其一般原理为:将两个本来关系就密切的关键词显得更密切,使关系疏远的关键词显现得更疏远,由此可以在某一主题内,明显区分核心和非核心概念。常见的共词关系相似度的计算方法有内积、Dice系数、Jaccard系数和余弦函数,本文为充分挖掘热点实体间潜在的关系,我们选择Jaccard系数作为共词关系计算系数,关键词D、D;的Jaccard系数定义为
5、:2 实现结果本文针对人员关系构建模型包括数据采集、知识抽取、模型效劳和图谱构建图1,利用收集的网络公开数据和实验数据来进行实验,对原始数据进行知识抽取,包括数据预处理、数据分类等,从而形成有效信息,在模型构建中我们利用用户行为驱动的社交网络演化分析模型和隐空间视角下的动态网络宏观微观结构演化分析模型,进行节点的重要性演化,构建动态复杂网络演化生成模型,并开展模拟实验,通过分析其实体间的行为构建人员关系图谱。本实验以人员身份证号模拟数据为实体,通过输入身份证号指定特定人员进行搜索分析,得到与其在飞机、火车或网吧通行的人员关联数据,并进行可视化展示图2。3 结论通过基于知识图谱的人员关系构建,可对人员实体信息包括人员根本信息、乘车记录等和虚拟信息包括微信、邮件、,上网记录等进行关联,实现多个实体人员关系图谱构建,可支撑公共平安领域的搜索、预测等业务的开展。参考文献1田星等,基于词向量的Jaccard相似度算法J.计算机科学.2023,707:186-1892张君,用户行为驱动的社交网络演化分析D.清华大学,20233马江涛.基于社交网络的知识图谱构建技术研究D.战略支援部队信息工程大学,20234曹倩,知识图谱的技术实现流程及相关应用J,情报理论与实践.2023,3812:127-131