网站首页  词典首页

请输入您要查询的论文:

 

标题 基于知识图谱的岭南文化热词分析与知识演化研究
范文

    薛云兰

    

    

    

    摘? 要: 随着计算机技术的发展,大量的岭南文化信息被记录下来。而海量的岭南文化信息却难以被有效地利用。文章采用知识图谱技术对岭南文化信息进行有效的语义抽取和融合,采用Citespace可视化分析软件完成了对岭南文化研究热词和趋势的研究,为岭南文化的人文历史的研究提供了技术框架和研究方案。

    关键词: 岭南文化; 知识图谱; 热词分析; 知识演化

    中图分类号:G202,G206? ? ? ? ? 文献标识码:A? ? ?文章编号:1006-8228(2021)02-49-03

    Abstract: With the development of computer technology, a large number of Lingnan cultural information has been recorded. However, the vast amount of Lingnan cultural information is difficult to be used effectively. This paper uses knowledge graph technology to carry out effective semantic extraction and fusion of Lingnan culture information, and uses CiteSpace visualized analysis software to complete the research on hot words as well as its trends of Lingnan culture, which provides the research of the humanistic history of Lingnan culture with a technical framework and research scheme.

    Key words: Lingnan culture; knowledge graph; hot words analysis; knowledge evolution

    0 引言

    岭南传统文化作为广东文化的重要名片,是广东对外人文交流的重要组成部分。“一带一路”倡议为广东和岭南传统文化“走出去”提出了新的历史使命。随着互联网+的飞速发展,海量数据的价值得以充分发挥,通过机器学习,知识图谱等技术来可视化岭南文化的演化路径是岭南文化研究领域之一。充分挖掘岭南文化的发展和演化,可以提高地域的影响力和关注热度,充分发挥地域的人文经济有重要的价值和参考意义[1]。互聯网信息化的发展给文化信息研究提供了丰富多样的软件和工具,为了直观的展示数据,采用知识图谱作为可视化工具来标注岭南文化每年的热词、热词的演化和热词之间的关联关系。

    知识图谱,主要是为领域知识映射地图,把知识之间的关联关系和发展演化用图形化的形式呈现出来。海量的信息被挖掘、清洗、抽取、标注、融合、加工最后形成一个具有参考意义的领域知识图谱,对于领域的研究和发展预测有一定的参考价值[2]。文献计量学是基于数学和统计学的定量分析方法,以参考文献为研究对象,然而知识图谱是该领域中新的研究领域,长期受到学者的关注并得到快速的发展[3-4]。

    CiteSpace是目前最为广泛应用的图谱绘制工具。事件的影响力分析、事件的演化路径、演化趋势,热点研究、行业领域、知识关联、本体研究等都可以利用CiteSpace可视化工具有效的解决[5]。对岭南文化研究领域的1500篇中文期刊文献进行梳理,绘制出知识图谱,进而挖掘岭南文化研究的五大热点主题:岭南文化、地域文化、广东、广州、岭南建筑等。通过对突现词的检测及分析,揭示出岭南文化演化路径及热点主题的变化态势。研究表明未来一段时期关于岭南文化自信建设及粤港澳大湾区发展等主题将成为未来的研究热点。

    1 研究方法

    知识图谱中,点代表客观事物,边代表了事物的属性或关系。CiteSpace就是基于共现聚类的思想,首先选取文献中的信息,接下来凭借信息与信息之间的联系类型和强度进行网络结构重构,然后多角度进行计算与统计分析,最后将结论进行可视化。

    1.1 数据清洗

    对岭南文化研究领域的1500篇核心期刊文献进行梳理,删除和本研究领域关联关系较弱的文献,以降低噪声和冗余。

    1.2 可视化分析

    采用Citespace可视化软件从中国知网对岭南文化相关核心期刊文献进行采集和数据处理。中国知网对于摘要和年份等信息有直接导出模式,并且支持批量导出。选取其中一篇导出论文,其中内容主要包括出处、作者、来源、题名、分类、年份、关键词、出版号、摘要和语言等基本信息。这些规范、可读性很高的信息对于我们进行关键词抽取分析是十分有帮助的[5]。

    1.3 建立知识图谱

    在知识图谱具体显示岭南文化研究概貌及结构的基础上,对每一热门内容进行细化、观测分析的解读,能够全面掌握研究热点与动态[6]。本文利用文献计量和信息可视化的方法分析了岭南文化领域的文章发表趋势和主要研究机构;通过共词分析、知识图谱和战略坐标分析,探讨新时期互联网和大数据环境研究方法下,岭南文化研究的发展特点和主题演化,为岭南文化研究工作的开展提供参考。使用词频统计方法,从文章的多种属性来量化分析文献特征,这些属性有文献数量、文献题目、作者、作者的机构等。通过作者和机构的共现关系,来构建关于岭南文化知识图谱,采用聚类和分类方法来分析岭南文化的热点和趋势问题。

    ⑴ 根据研究发文趋势和Citespace分析结果,采用固定时间窗口的方法,将论文数据划分为连续子时期。提取各子时期关键词,并对同义词进行合并处理。利用共词分析法,构造各子时期高频关键词的共词矩阵;运用SPSS进行关键词系统聚类,识别各子时期研究主题[7]。

    ⑵ 基于各子时期关键词共现网络,计算各研究主题高频关键词的E相似度指数:Sij=Wij/(Wi×Wj),其中,Wij表示关键词i和关键词j共同出现的次数,Wi表示关键词i在所有文献中出现的次数,Wj表示关键词j在所有文献中出现的次数。

    ⑶ 知识图谱以X轴和Y轴二维图展示,用圆形表示热词,圆形的面积大小和热词的文章数量成正相关,我们通过圆形的大小量化岭南文化每个热度的影响力,通过各个圆点之间的联系边呈现热词的演化路径,对于岭南文化的演化有非常大的参考价值和指导意义。

    2 研究热点与趋势分析

    2.1 关键词共现分析

    本文检索了1994年至2019年共计1500篇关于岭南文化的文献。将这些数据导出后保存为纯文本,用陈超美教授开发的CiteSpace软件对这些数据进行图谱绘制,进行进一步的分析。

    节点大小代表该节点词频的高低,节点越大代表词频越高,其中的不同颜色分别表示不同的年份,由1994年到2019年,有暖色调像冷色调转变。图谱中的节点大小代表岭南文化热点研究的影响力,连线的粗细代表其联系强度。由圖1可见,广东节点最大且居图谱中心位置,表明其为研究的核心在该领域的影响力最大。广州、广府文化、岭南等节点较大且位居中心位置,构成了该领域的研究热点。

    2.2 文献主题变迁分析

    “图谱”是指进过系统编辑并根据实物描述或摄制的图,是研究某一学科所用的资料。“图谱”中的“图”指地图,“谱”指系统。图与谱合一则是空间与时间动态变化的统一表述。图谱主要表现事物和现象的形态结构、成因机制、组成物质、动态变化等综合性、复杂性规律,往往以系列图的形式表示时空动态变化。随着科学计量学从数学表达方式揭示科学知识及其活动规律,转向图形表达方式,形成了最初的知识图谱。

    从图2可以看出从二十一世纪九十年代开始到2019年,岭南文化研究热点的变化趋势,从广东、岭南学、广东人逐步发展到文化自信和粤港澳大湾区。这些研究的关键词之间的关联关系可以给将来的进一步研究提供很好的参考价值和预测估计。

    2.3 关键词突现分析

    从图3可以看出从二十一世纪九十年代开始到2019年,在2007年到2010年间岭南文化关于岭南学的研究热度最高,热度其次的是1994-1999的岭南文化关于岭南地区研究,1994-2000的岭南文化关于广东的研究,2001-2002的岭南文化研究以及2008-2010关于岭南文化的构建研究。逐渐发展到近期的研究热度新高的2014-2017的新岭南文化的研究、文化自信的研究。根据图3,我们不仅能看到岭南文化研究的趋势,还能统计出热点研究维持的热度及其影响力。

    3 结束语

    岭南文化研究自1994年起步以来,受关注度不断增强,发文整体呈增长趋势,2010年后发文基本稳定,领域发展趋于成熟。知识管理是岭南文化研究领域基础的、具有发展潜力的研究方向。现代信息环境下衍生出与知识服务相结合的知识图谱、关联数据、可视化及前沿热点研究等处于成长状态的热点主题。新技术环境下,实现知识管理模式的转型与优化,将成为岭南文化研究知识服务研究的一个重要主题。

    参考文献(References):

    [1] 段园园,林树文,黄金泽,曾玉荣.知识图谱视角下我国农业政策研究的演化发展及热点分析[J].南方农业学报,2018.49(1).

    [2] 张晓林.走向知识服务:寻找新世纪图书情报工作的生长点[J].中国图书馆学报,2000.5:30-35

    [3] 邱均平,王曰芬.文献计量内容分析法[M].国家图书馆出版社,2008.

    [4] 陈悦,陈超美等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015.2:242-253

    [5] 陈悦,陈超美等.引文空间分析原理与应用[M].科学出版社,2014.

    [6] 吴宾,唐薇.基于知识图谱的国内养老政策研究热点主题与演化路径(2005-2016)人口与发展[J].人口与发展,2018.24(2).

    [7] 詹婧,张仁琼.基于文献计量的图书馆MOOC研究[J].图书馆学刊,2017.39(8):106-113

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2024/12/22 18:48:53