网站首页  词典首页

请输入您要查询的论文:

 

标题 铸牢网络空间中华民族共同体意识的知识图谱实践探索
范文

    刘爽 陈鹏 孟佳娜

    

    

    

    摘? 要: 构建社会主义核心价值观垂直领域知识图谱,铸牢网络空间的中华民族共同意识,实现思想政治教育、计算机学科、新兴交叉学科多学科融合。知识图谱构建包括知识建模,知识抽取、知识融合、知识存储四部分。。构建完成的知识图谱有助于增强网络空间中华民族共同体意识传播的智力支持,丰富网络传播内涵,提升中华民族的凝聚力和向心力。

    关键词: 网络空间; 中华民族共同体意识; 知识图谱; 社会主义核心价值观

    中图分类号:G642? ? ? ? ? 文献标识码:A? ? ?文章编号:1006-8228(2021)02-105-04

    Abstract: Constructing the vertical domain knowledge graph of the socialist core values, forges a strong sense of Chinese national community in cyberspace to realize the multi-discipline integration of ideological and political education, computer discipline and emerging interdisciplinary. The construction of knowledge graph includes knowledge modeling, knowledge extraction, knowledge fusion and knowledge storage. The knowledge graph is helpful to enhance the intellectual support of the spread of the sense of Chinese national community in cyberspace, enrich the connotation of network communication, and enhance the cohesion and centripetal force of the Chinese nation.

    Key words: cyberspace; the sense of Chinese national community; knowledge graph; socialist core values

    0 引言

    党的十八大在总结改革开放四十年的成功经验和丰硕成果,以及展望未来社会主义建设宏图的基础上,高瞻远瞩地运用马克思主义的历史唯物观提出了社会主义核心价值观[1]。社会主义核心价值观以“富强、民主、文明、和谐”为价值目标,以“自由、平等、公正、法治”为价值取向,以“爱国、敬业、诚信、友善”为价值准则,这三者相互联系、相互贯通,将政治理想、社会导向、个人行为有机地统一在一起,实现了国家、社会、个人三方主体在价值目标上的统一,集中体现了国家、社会、个人三个不同层次的愿望与诉求[2]。

    社会主义核心价值观是对中华优秀传统文化的继承和升华,它把涉及国家、社会、公民的价值要求融为一体,赋予中华优秀传统文化以新的时代内涵。

    中华民族作为具有数千年历史的文明古国,虽然历经千百年的沧桑却生机勃勃,一个不可忽视的重要因素就是中华文化的世代传承、源远流长。作为一个多民族国家,各民族能共享福祉、荣辱与共,一个不可忽视的重要因素是我们拥有中华文化带给我们的精神归根的家园,以及由此而来的强烈文化认同感和价值观认同[3]。正如习近平总书记所指出:“我们生而为中国人,最根本的是我们有中国人的独特精神世界,有百姓日用而不觉的价值观。我们提倡的社会主义核心价值观,就充分体现了对中华优秀传统文化的传承和升华”[4]。

    随着国家政策的导向和信息的传播,人们越来越意识到社会主义核心价值观的重要性。截至2019年6月,我国网民规模达8.54亿,较2018年底增长2598万,互联网普及率达61.2%,较2018年底提升1.6个百分点;我国手机网民规模达8.47亿,较2018年底增长2984万,网民使用手机上网的比例达99.1%,较2018年底提升0.5个百分点[5]。移动互联网接入流量消费达553.9亿GB,同比增长107.3%。由上述数据可知,互联网正以爆炸式的方式迅猛发展。互联网上的社会主义核心价值观数据大部分以网页或文档形式存在。用户在预览和搜索相关知识时,会比较耗时耗力,而且搜索结果不具有直观性。针对这一需求,开发实现了一款社会主义核心价值观知识图谱可视化系统,借助自然语言处理技术和深度学习前沿技术对这些海量数据进行分析处理和结构化整理,利用知识图谱技术得到科学可视化结果和智能搜索功能,实现网络空间的社会主义核心价值观培育的引领作用,铸牢网络空间的中华民族共同体意识建设。

    1 社会主义核心价值观知识图谱构建流程

    本文开发实现的社会主义核心价值观知识图谱可视化系统构建流程如图1所示。该系统可以满足如下两种需求:一是能够以知识图谱的形式存储和表现社会主义核心价值观的相关知识,将数据与数据之间建立起联系,提高检索效率;二是能够以直观,简洁的形式将知识图谱进行可视化展示,并实现智能搜索,为用户获取知识提供了便利,提高了用户体验。

    2 技术实现细节

    社会主义核心价值观知识图谱可视化系统,以构建社会主义核心价值观知识体系为目的,主要实现知识图谱的构建、知识可视化展示功能。利用了知识图谱的结构化存储特点,将一些分布在各个网站中的社会主义核心价值观相关知识进行整理和融合,方便用户进行查找和使用。

    知識图谱的结构以三元组的形式为主,即(实体,关系,实体)和(实体,属性,值)。知识图谱构建方式包括自顶向下与自底向上两种流程[6]。自顶向下的构建方式是基于对构建领域相关知识的深入了解,借助于百科类网站等结构化资源信息,划分知识的类别与范畴,以知识之间的逻辑关系与层级结构为框架,从点到面、从中心到外围,将实体进行手动链接;而自底向上的构建方式是借助相关的知识抽取技术,从公开规范或专业领域的数据集中提取信息资源,挖掘其中蕴含的实体与关系,选择可靠性强、相关度高的填充到知识库,从而实现图谱构建。本系统最终采用自底向上的构建方式。知识图谱构建流程涉及知识建模,知识抽取、知识融合、知识存储四部分。

    1.1 知识建模

    知识建模又叫业务建模,是根据社会主义核心价值观的一些规则和定义,对要构建的知识图谱进行设计,主要包括实体定义、关系定义、属性定义及事件定义等。设计社会主义核心价值观知识图谱是构建应用过程中最重要的一步。根据其相关知识的特点,从百科类网站、人民网、中国文明网等相关网站经过信息对比,分析后,确定社会主义核心价值观知识涉及的領域,将其规划统一,确定知识图谱中的实体类别,实体属性和实体关系。初步设定该图谱以“社会主义核心价值观”为中心实体节点,“富强”、“民主”、“文明”、“和谐”、“自由”、“平等”、“公正”、“法治”、“爱国”、“敬业”、“诚信”、“友善”为一级实体节点。

    图谱中其余包含的实体类别如表1所示。

    每个实体类别包含多个实体,部分实体包含一些特定属性,如富强的简介会当作富强这一实体节点的属性。根据实体类别之间的联系创建关系,如“爱国”和政策之间可创建三元组(爱国,相关政策,《新时代爱国主义教育实施纲要》)。

    1.2 知识建模

    原始数据主要来源为百度百科、某些相关新闻网站。其数据类型主要包括结构化数据、半结构化数据,非结构化数据。对于半结构化数据大都采用爬虫技术+包装器+正则表达式。对于非结构化数据主要采用命名实体识别技术,关系抽取方法以及相关自然语言处理工具。对于部分非结构化数据,本系统使用命名实体识别技术进行实体抽取。命名实体识别本质上可以看作是一种序列标注问题,其实现的中心思想是根据输入的句子,预测出其标注序列的过程。经过调查后,本系统选择了采用BIO标注和基于字符嵌入的Bi-LSTM+CRF神经网络实体识别模型。BIO标注又称为三位标注。它的基本形式为B-begin,I-inside,O-outside。B-begin 代表一个实体的开头,I-inside代表这个实体的结尾,O则代表不属于任何类型。

    Bi-LSTM+CRF神经网络实体识别模型主要包括Bi-LSTM模块和CRF模块。主要实现过程为使用预训练字向量,作为embedding层输入,然后经过双向LSTM层进行编码,编码后加入dense层,最后送入CRF层进行序列标注。

    Bi-LSTM是Bi-directional Long Short-Term Memory的缩写,是由前向LSTM与后向LSTM组合而成[7]。长短时记忆模型的优势在于保留了RNN处理序列模型的特点,其特有的门结构也在一定程度解决了梯度爆炸和梯度消失的问题。前向的LSTM与后向的LSTM结合成Bi-LSTM。Bi-LSTM模型在保留其优点的同时,通过分别训练前后向序列兼顾了上下文信息,可以更好的提取深层次的语义信息。

    1.3 知识融合

    知识融合又分为模式层的融合以及数据层的融合,模式层的融合主要包括概念、概念的上下位、概念的属性这些统一;数据层的融合主要是将不同数据来源的数据的相同实体的不同表达形式进行融合,包括实体的合并、实体属性与关系的合并等。这一步工作涉及的技术有实体对齐、指代消解等。

    1.4 知识存储

    根据业务的特点和需求,以及数据的规模选择合适的存储方式。目前市面上的知识图谱,按存储形式划分可以分为两类。一种是使用以RDF为存储结构的知识图谱;另一种是使用图数据库的知识图谱。这里选择使用Neo4j图数据库进行数据存储。

    将经过数据预处理和知识融合后的数据,导入到图数据库Neo4j中,根据知识建模中的设计原则创建实体节点和节点关系。本文选择 Cypher语句构建初始的知识库。

    1.5 智能搜索

    智能搜索是从海量的信息源中通过约束条件和额外信息运用算法找到问题所对应的答案。在本系统中,实现智能搜索的主要步骤为:首先使用自然语言处理技术对用户输入的句子进行解析,根据分词,词性标注等方法识别出句子中的实体;然后使用关系抽取模型Attention+Bi-LSTM,进行句子中的关系检测操作;最后将前两步获取到的结果即实体和关系相结合,使用cypher语言到知识图谱中进行检索,并将检索到的结果返回给用户。

    2 可视化设计及结果

    系统通过Django框架来连接前后端。Django框架[8]的核心包括一个轻量级的Web服务器,用于接受HTTP请求,一个基于正则表达式的URL分发器,一个数据库模型用于建立数据模型与数据库相映射,一个视图系统用于处理请求,以及一个模版系统。本系统使用Django框架实现前后端的交互页面。对于知识查询功能主要采用实体查询,即通过对用户输入的实体名称在图数据库Neo4j 中检索,返回结果为相应节点以及其一级关系节点图,并通过 D3.js 将数据渲染成导向图进行可视化展示。除单个实体查询功能外,本系统提供知识图谱全局显示的功能,即可展示所构建的社会主义核心价值观知识图谱全貌。图2是部分图谱可视化效果,图中每个节点代表一个对象,节点之间的连线代表对象之间的关系。

    3 结束语

    本文从网络空间的中华民族共同体意识多模态数据出发,构建社会主义核心价值观垂直领域知识图谱。这有助于占领和巩固意识形态斗争的网络阵地,强化网络空间的中华民族共同体意识,强化文化认同感、政治认同感、共筑网络智慧家园,为网络空间的中华民族共同体意识铸牢提供智力支持。

    参考文献(References):

    [1] 中国共产党新闻网.http://theory.people.com.cn/n1/2017/0906/c413700-29519535.html[EB/OL].last accessed 2020/07/10.

    [2] 魏波.论社会主义核心价值观三个层面之间的关系[J].理论探讨,2015.3:26-30

    [3] 中国共产党新闻网.http://theory.people.com.cn/n/2014/1007/c40531-25782571.html[EB/OL].last accessed 2020/07/10.

    [4] 中国共产党新闻网.http://theory.people.com.cn/n1/2017/0609/c40531-29328920.html[EB/OL].last accessed 2020/07/10.

    [5] 第44次《中国互联网络发展状况统计报告》发布, http://www.cac.gov.cn/gzzt/ztzl/yjzt/wlcbzz/jiuy/ts/webinfo/2020/05/1590838527373652.htm[EB/OL].访问时间2020/05/20.

    [6] 知识图谱的构建方法.https://www.cnblogs.com/coodream2009/p/10213819.html,访问时间2020/05/20.

    [7] Wang Y, Chen Q, Ding M, et al.: High Precision Dimensional Measurement with Convolutional Neural Network and Bi-Directional Long Short-Term Memory (LSTM)[J].Sensors, 2019.19(23):5302

    [8] 白相辰.基于Django框架的Web在线教育平台的设计与实现[D].北京交通大学,2019.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/10 13:21:42