收藏 分享(赏)

基于卷积推理的多跳知识图谱问答算法_潘海明.pdf

上传人:哎呦****中 文档编号:2253055 上传时间:2023-05-04 格式:PDF 页数:11 大小:1.33MB
下载 相关 举报
基于卷积推理的多跳知识图谱问答算法_潘海明.pdf_第1页
第1页 / 共11页
基于卷积推理的多跳知识图谱问答算法_潘海明.pdf_第2页
第2页 / 共11页
基于卷积推理的多跳知识图谱问答算法_潘海明.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 41 卷 第 1 期2023 年 1 月 广西师范大学学报(自然科学版)Journal of Guangxi Normal University(Natural Science Edition)Vol.41 No.1Jan.2023DOI:10.16088/j.issn.1001-6600.2022031703http:潘海明,陈庆锋,邱杰,等.基于卷积推理的多跳知识图谱问答算法J.广西师范大学学报(自然科学版),2023,41(1):102-112.PANH M,CHEN Q F,QIU J,et al.Multi-hop knowledge graph question answeri

2、ng based on convolution reasoningJ.Journal of Guangxi NormalUniversity(Natural Science Edition),2023,41(1):102-112.?基于卷积推理的多跳知识图谱问答算法潘海明1,陈庆锋1,邱 杰2,何乃旭1,刘春雨1,杜晓敬1(1.广西大学 计算机与电子信息学院,广西 南宁 530004;2.玉林师范学院 计算机科学与工程学院,广西 玉林 537000)摘 要:多跳问题相比于简单问题更符合人们日常的提问方式,同时,研究多跳知识图谱问答(KGQA)算法有助于智能问答系统的推广。然而,现有的多跳 KG

3、QA 方法在 23 跳问题和不完整知识图谱上的答案推理能力较弱。针对这一问题,本文提出基于卷积推理的多跳 KGQA 算法。首先,为了获取更具表示能力的问题嵌入向量,本文根据问题与关系的语义相似性提出结合字符特征和语义特征的问题嵌入模型;而后,为了增强算法的长链接推理能力,提出基于卷积神经网络(CNN)的答案推理模型来抽取嵌入向量的高阶信息。实验结果显示,相比于已有的 5 种算法,本文算法在 MetaQA数据集的 2 跳和 3 跳问题答案预测准确率分别提高了 1.7 和 1.3 个百分点,在不完整知识图谱的 2 跳和 3 跳问题上分别提高了 9.4 和 9.3 个百分点。关键词:知识图谱问答;知

4、识图谱嵌入;语言模型;卷积神经网络中图分类号:TP391.1 文献标志码:A 文章编号:1001-6600(2023)01-0102-11自然语言处理和自动化信息处理技术的发展使得我们能够从大量非结构化、半结构化数据中将知识抽取、提炼生成结构化知识。这些结构化知识遵循已定义良好的正式语法和语义,同时还可以跨不同的源和接口进行操作,其中主要例子是一种特殊的基于图的数据类型称为知识图谱1。虽然,通过具有明确语法的形式化查询语言可以方便地访问存储在知识图谱中的知识,然而使用查询语言来访问知识图谱给非专业用户的使用带来了极大困难,因为形式化查询语言要求用户理解其语法,以及实体的底层结构和关系。因此研究

5、人员设计出知识图谱问答系统,以方便更多非专业人员获取知识图谱中的知识。知识图谱问答系统提供提问的界面,用户通过输入自然语言问题就可以收到问答系统知识图谱生成的简明答案。目前,知识图谱问答系统已经在多个领域得到应用,例如中文医疗问答系统2-4、智能客服系统5-6、教育领域的知识问答系统7等。由于知识图谱问答系统的广泛用途,近年来,越来越多的研究人员开始关注该领域的发展,并不断提高知识图谱问答算法性能。在现实世界中,为了回答用户的提问,问答模型通常要在知识图谱中进行 23 跳的推理以找到问题的答案实体。因而多跳知识图谱问答算法也成为研究人员重点研究的领域。多跳知识图谱问答系统通常包含 3 个模块:

6、知识图谱嵌入模块、问题嵌入模块和答案推理模块。知识图谱嵌入模块主要由知识图谱嵌入算法8构成,该类型算法能够将知识图谱中的实体和关系转化为嵌入向量的形式,并用于知识图谱中的答案推理;问题嵌入模块主要利用自然语言处理中的语言模型9将问题转化为嵌入向量,高质量的问题嵌入模型能够有效地引导答案推理模块;答案推理模块在前 2 个模块的基础上使用图神经网络、逻辑规则设计等方法在知识图谱中完成答案推理过程,并在候选答案中筛选出正确答案。目前已有的多跳知识图谱问答算法根据其采用的答案推理方法的不同,主要分为 3 种方法:基于图神经网络的方法、基于查询图的方法和基于知识图谱嵌入的方法。目前图神经网络已在生物信息

7、10-11、自然语言处理和计算机视觉等领域得到广泛应用。由于图神经收稿日期:2022-03-17 修回日期:2022-04-19基金项目:国家自然科学基金(61963004,61862006);广西自然科学基金重点项目(2017GXNSFDA198033)通信作者:陈庆锋(1972),男,广西柳州人,广西大学教授,博士。E-mail:http:网络在处理社交网络、知识图谱等非欧几里得的图数据时展示出优越的性能,近年来一些学者将图神经网络引入知识图谱问答领域。基于图神经网络的方法采用语义匹配或启发式方法在知识图谱中构建问题子图,然后利用图神经网络的节点分类方法,将子图中的节点分为答案节点和非答案

8、节点 2 种类型。Sun等12-13提出一种基于异构图神经网络14的 KGQA 方法,通过添加文本信息来解决知识图谱的不完整性问题。在构造问题子图后,分别通过异构图神经网络更新实体嵌入和文本嵌入,最后,利用图节点分类方法对答案进行过滤。该方法可以在大型知识库和语料库中回答多跳问题。李肯立等15利用实体近义词字典与问题进行词义匹配获取主题实体,并以主题实体为中心构造问题子图,然后输入训练好的图嵌入匹配模型中,以得到问题的答案。该方法解决了语义解析方法的模板不能完全适用所有自然语言问句,以及查询效率低下的问题。Han 等16-17提出一种基于超图卷积网络的多跳 KGQA 模型,使用主题实体及其邻近

9、的实体和关系来构造超图,并将成对的连接转换为节点。此外,在多跳问答推理中,通过关系与问题之间的相似性,采用共同注意来计算关系的注意权重。该类型方法存在的问题是,通过语义匹配获取的问题子图不能百分百确定包含问题答案,因而导致模型无法选中正确答案。基于查询图的方法则将问题中包含的实体作为种子节点,利用强化学习和语义匹配技术不断迭代扩张查询图,并通过打分的方式筛选出得分最高的节点作为答案。Yih 等18提出一个基于查询子图的KGQA 框架,首先为问题中包含的实体构造一个查询子图,选择核心关键路径,进一步展开查询子图,生成新的候选子图,通过语义匹配和迭代生成下一个子图,直到 t 跳,最终选择在查询子图

10、中得分最高的实体作为答案。Lou 等19提出一种用于语义匹配的 KGQA 模型。首先,使用 Bi-GRU 网络分别对问题和实体路径进行编码,获得问题特征;然后,应用查询子图中的所有属性名称代码和属性 ID 代码来得到图的代码;最后,利用余弦相似度计算问题和查询子图之间的相似度,以返回最佳的子图和答案。Lan 等20提出一种新的查询子图构造方法,通过波束搜索迭代生成候选查询子图。在每次迭代中,每个查询子图都由一个 7 维特征表示;然后使用 FFN 对特征进行编码,并通过 Softmax 获得查询子图得分结果;最后,使用评分函数计算所有查询子图的答案得分,并找到下一次迭代的 Top-k 个查询子图

11、,直到该迭代生成的子图的得分不高于上一次迭代生成的所有子图的得分为止。该类型方法需要手动设计推理的逻辑过程,对于小规模的问题数据集有良好的答案预测准确率,但是处理大规模的问题数据集时耗时较长。基于知识图谱嵌入的多跳知识图谱问答模型,主要依据问题与知识图谱中的关系存在语义相似度的特性,利用知识图谱嵌入模型的三元组得分函数构建答案得分函数。Saxena 等21首先使用知识图谱嵌入Complex 模型22,以获得包括实体和关系在内的训练前嵌入;然后,根据 Roberta 语言模型23得到输入问题句子的嵌入问题;最后,结合问题、主题主体和候选答案的嵌入,构建一个答案评分函数来确定最终的正确答案。该模型

12、消除了多跳问答系统中对实体链接路径的依赖性,并通过问题嵌入和知识图谱嵌入模型生成候选答案的分数。Sun 等24提出一种基于 box embedding 的新的 KGQA 方法,利用稀疏矩阵的不同运算来表示逻辑推理中的并集和交集,并通过神经网络获得从主体实体到答案实体的推理路径。张天杭等25提出一种知识图谱嵌入评分与链路评分相结合的答案评分方法,以解决中文领域的多跳知识图谱问答任务。该方法在搜索最优答案的同时构建一个查询链路,通过查询给出答案集合。基于知识图谱嵌入的多跳知识图谱问答算法相比于另外 2 种类型方法,有答案返回效率高、准确率高的特点,且不需要复杂的逻辑推理过程以及文本数据的辅助,但其

13、存在 2 个局限:一是长链接的知识推理能力较弱,这是由于知识图谱嵌入模型在获取嵌入向量时仅考虑相邻的实体和关系,这导致实体之间的关联随着路径的增加会变得越来越弱,因而在进行 23 跳问答推理时,问答模型的答案预测能力急剧下降;二是当知识图谱中的知识不完整时,知识图谱嵌入模型获取的实体或关系嵌入向量将会变得更弱,使得模型在问题和实体链接进行语义匹配时出现误判的情况,进而导致模型在不完整知识图谱与完整知识图谱上的答案预测准确率有较大差距。针对以上问题,本文提出一种基于卷积推理的多跳问答算法。为了提高算法在 23 跳问题的答案预测准确率,提出结合字符特征和语义特征的问题嵌入模型,以获取更具表示能力的

14、问题嵌入向量。在答案推理方面,提出基于卷积推理的答案推理模型。该模型采用二维卷积神经网络对问题的主题实体和问题301广西师范大学学报(自然科学版),2023,41(1)的嵌入特征进行深层的特征提取,并结合多层前馈神经网络获取其组合特征向量,最后,结合组合特征向量以及候选答案嵌入向量,使用知识图谱嵌入的得分函数计算候选答案的得分,并将得分最高的实体作为最终答案。1 基于卷积推理的多跳知识图谱问答算法如图 1 所示,本文提出的知识图谱多跳问答模型包含 3 个模块:问题嵌入模块、预训练知识图谱嵌入模块和答案推理模块。在问题嵌入模块中,为了获取更具表达能力的问题嵌入向量,首先,通过预训练词向量和卷积神

15、经网络获取单词的字符特征;然后,连接每个单词的语义特征和字符特征输入 Zhou 等26的BiLSTM 语言模型获取问题中单词的嵌入向量;最后,通过全局注意力机制获取问题嵌入向量。在预训练知识图谱嵌入模型中,采用了 Saxena 等21的预训练 Complex 知识图谱嵌入模型,获取实体的嵌入向量。在答案推理模块中,先拼接主题实体嵌入向量和问题嵌入向量生成组合的特征矩阵,并通过卷积神经网络和前馈神经网络的组合获取组合嵌入向量,然后将组合向量与候选实体嵌入向量的相似度作为答案得分,并将得分最高的实体作为问题的答案。语言模型问题知识图谱预训练知识图谱嵌入模型基于卷积推理的答案推理模型答案得分函数答案

16、问题嵌入向量实体嵌入向量图 1 本文算法流程Fig.1 Flow chart of our algorithm1.1 结合字符特征和语义特征的问题嵌入模型语言模型可以更好地捕捉自然语言问题的特征,完成对下游答案的预测。早期的 Word2Vec27从单词上下文中获得单词表示;GloVe28不考虑在本地窗口之外的单词之间的连接;Elmo29使用了大量的训练样本,通过构建多层堆栈 LSTM 来获得预训练词向量;BERT30使用转换器进行编码,并在预测单词时考虑了 2 个方向上的上下文特征。基于知识图谱嵌入的多跳知识图谱问答算法将问题嵌入向量用于构建答案推理模块的答案得分函数。因此,语言模型所生成的问题嵌入向量的质量将影响到多跳知识图谱问答算法的答案预测准确率。为了能够获取更具表示能力的问题嵌入向量,本文提出一个结合单词的语义特征和字符特征的问题嵌入模型。为了能够更加灵活地使用语言模型构建预训练词向量,同时构建单词的字 符 和 语 义 特 征,本 文 提 出 的 问 题 嵌 入 模 型 首 先 通 过 Word2Vec 分 别 获 取 问 题 q=,w 1(),w l(),()中每个单词 w=

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2