标题 | 基于规则学习的知识图谱构建技术 |
范文 | 巩在杨 摘要:近年來,知识图谱由于其表达丰富信息的能力和在基于知识的推理中的应用潜力而受到了广泛的关注。 例如,它们可以协助与移动服务中的用户关联、交换策略和流量内容相关的深入知识发现。 知识图谱将实体和关系投影到密集和低维的向量中,从而有效地测量这些实体之间复杂的语义信息和关系。 然而,传统的知识图嵌入方法只考虑直接事实,在面对稀疏数据时,很难实现对实体和关系的合理嵌入学习。 为了解决这一问题,本文提出了一种基于规则学习相结合的知识图谱方法。 中图分类号:G4文献标识码:A文章编号:(2021)-04-404 导言 近年来,知识图谱因其强大的语义处理能力和灵活的互连能力而受到学术界和工业界的广泛关注。 知识图提供了一种更有效的方法来测量、组织、管理和利用大数据,使网络更加智能,能够更接近人类的推理。 例如,知识图可以帮助第五代(5G)移动服务的移动流量预测和用户关联发现。为了支持相应的基于知识的推理任务,包括谷歌、微软、百度和中国移动在内的各种公司都渴望建立知识图表,并在知识管理、自动问答系统和智能搜索等领域广泛应用. 互联网上有许多知识库,每个知识库的规模都非常大。然而,这种存储方法面临着数据稀疏、计算效率低、可重用性差等问题. 因此,需要一种能够准确和快速地表示知识图的有效方法。 近年来,代表性的深度学习在文本分析、图像分析、语音识别和自然等领域取得了显著的成就。在现实世界中可以知道许多可能的事实,以及数字.在试图收集这些事实时可能会出现实际困难,;因此,事实和关系在现有的情况下总是不完整的知识图。 1.相关工作 在矩阵中,若数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律时,则称该矩阵为稀疏矩阵;与之相反,若非0元素数目占大多数时,则称该矩阵为稠密矩阵。定义非零元素的总数比上矩阵所有元素的总数为矩阵的稠密度。 知识表示学习的前提是表示学习,那么表示学习就是把图像、文本、语音等的语义信息表示为低维稠密的实体向量,即Embedding。Embedding是大家都熟知的,自从13年出现的word2vec,Embedding成为NLP任务的标配。 知识表示学习存在两大问题: 1.计算效率:图表示的知识表示简单直观,通俗易懂,但是图算法的复杂度高。 2.数据稀疏:不知道大家知不知道长尾分布,长尾上面实体和关系的语义信息很难捕获。 目前来看,从工业界和学术界基本都是在翻译模型之上研究或者根据业务进行调整,而其他的上述模型大概存在两个问题,一个是实体和语义之间的关系很难刻画的好,另一个就是计算复杂度很高。 知识表示学习目前的一些主要方法包括以下几个: 1.距离模型(Structured Embedding, SE) 2.单层神经网络模型(Single Layer Model, SLM) 3.能量模型(Semantic Matching Energy, SME) 4.双线性模型 5.张量神经网络模型(Neural Tensor Network, NTN) 6.矩阵分解模型 7.翻译模型 本文提出了一种基于规则学习的知识图谱嵌入模型。嵌入学习和规则学习被迭代地执行,以不断地以三元组的形式生成新的事实,以在基于知识的推理中获得更好的性能。 1.1.嵌入方法 翻译模型将实体之间的关系视为一种翻译过程,利用基于距离的评分函数,通过基于两个实体之间的关系进行翻译,然后计算实体之间的距离,来衡量真正三重的可能性。 1.2.规则学习 增加对关系的领域和范围的限制,因为先验知识限制了现有的表示学习模型。 在样本的选择过程中,只考虑表现出正确类型关系的三元组进行建模;因此,不相关或错误的样本可以在一定程度上有效地过滤掉,从而提高了表示性能。 通过编码器将实体级信息添加到表示学习模型中。可用于为不同层次的实体创建融合语义向量,以提高表示效果。 引入了额外的基于文本的信息,并通过将知识图中的事实三元组与文本中的实体描述相结合来进行联合模型训练,从而提高了模型预测复杂关系的实体链接的能力。通过提出一种基于归纳逻辑规划的模糊规则挖掘算法的改进方法。 该算法克服了传统规则挖掘算法在开放世界假设基础上生成负证据的困难,提出了一种联合嵌入规则和三元组的方法。 该方法基于TransE模型学习规则,并结合规则对嵌入进行重构。 无标签的情感认知学习方法,以实现对大量未标记数据的利用。 本文提出了一种基于规则学习嵌入模型的提议。我们的模型通过规则学习生成公理,并将它们注入知识图的嵌入表示中,以增强推理。我们模型的关键思想,其中规则被学习和嵌入,然后迭代地应用于基于分解的知识图谱。建模过程包括两个主要阶段:嵌入学习和规则学习。 基于以上介绍的相关技术和实验结果,我们构建了一个基于多视图知识图的大学教师评价系统。利用数据库和构建的知识图设置评价指标,包括传统指标(如h指数、论文数和引文数)、学生评价和定制指标(如本文提出的知识图谱模型)。 在显示层中,教师评价结果和学术关系以雷达图、曲线图、条形图、关系图等形式可见。 此外,还增加了评价过程的优化。通过对新模型的比较和分析,选择不同的评价算法,并根据专家学者的反馈对评价指标进行调整。 参考文献 [1] 王华伟,周和玉,韦靓,郏林,张然,王海泉,于雷.基于领域知识词网的学科知识簇实现初探———以武汉理工大学自动化学科知 识簇建设为例[J].情报理论与实践,2012,35(9):5-8. [2] 钟绍春,唐烨伟.人工智能时代教育创新发展的方向与路径研究[J].电化教育研究,2018,39(10):15-20,40. [3] Antoine Bordes, Nicolas Usunier, Alberto Garcia-Duran, Jason Weston, OksanaYakhnenko, Translating embeddings for modeling multi-relational data, in:Advances in Neural Information Processing Systems, 2013, pp. 2787–2795. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。