标题 | 知识图谱在农业信息服务中的应用进展 |
范文 | 刘家玮 刘波 沈岳 摘要:本文从湖南国家农村农业信息化示范省综合服务平台建设推进过程中对农业知识库的构建、收集、整理、展示所面临的问题出发,通过对国内外农业信息化相关领域及知识图谱的绘制工具、绘制构建方法对比分析,探索知识图谱技术应用于农业信息服务的必要性与可行性,及利用湖南农业产业知识搭建一个多尺度查询、快速展示的农业知识群图谱可视化系统的初步解决方案,进一步扩展知识图谱技术应用于农业生产领域的范围。 关键词:知识图谱;农业信息服务;农业知识库;多尺度查询 中图分类号:TP393 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.03.006 本文著录格式:刘家玮,刘波,沈岳,知识图谱在农业信息服务中的应用进展[J],软件,2015,36(3):26-30 0.引言 随着中央不断聚焦我国“三农”问题,2011年湖南省被列为国家农村农业信息化示范省建设试点单位。为了建设有用、准确、便捷、全面、专业的农业科技服务知识平台,项目组针对湖南省农业生产的特点,结合湖南农村社会结构背景,吸取总结国内外农业数据库开发的成功经验,创建服务于湖南三农的知识平台与知识库群,覆盖湖南省农村“百万农户”和“万家企业”两大主体,吸纳农业专家与种养能手的经验智慧、网络与文献优质信息等多种资源,并通过网络、手机、广播、呼叫中心等多种平台推送农业知识。 虽然当前构建的知识库条目众多,但各个条目之间的关联度不强,能否构建一种查询直观、知识条目展示智能的方法是项目组成员努力的方向。 1.农业信息服务进展 随着全球人口的增加、可用耕地的减少与全球气候的变化,粮食安全面临巨大的挑战,成为各国政府关心的中心议题,如何确保粮食安全也成为人类面临的一大难题。 近年来国外农业信息化发展较快,许多学者都致力于农业信息化的普及与推广。Yubin Yang利用美国国家农业统计服务中心提供的农田数据,利用多空间尺度方法分析作物种植情况及分布地图,指导作物种植;Mokotjo介绍了南部非洲莱索托国有关农业信息化的进展情况;Georg Steinberger介绍德国精准农业方面的应用,特别是利用传感器采集农业信息,不仅生产者的工作强度减轻了,而且农业数据精度提高了,从而推动农业与环境实现可持续发展;Ian Unwin遵照欧洲标准,介绍利用PubMed数据中心提供的数据创建食品知识库的过程,通过标引有助消除重复性工作。 我国也非常重视农业信息服务。特别是近十年以来,每年中央一号文件都重点关注“三农”问题。近年来随着中央政府的大力推进,农业信息化服务在国内发展较快,许多省市都构建了农业信息化服务平台。国内学者也在此方面发表了多篇研究文献,如王曦光从我国农技推广中存在的问题出发,利用计算机技术和信息技术为基层农技员和农户设计一套可以实时提供准确农业知识资源的知识服务系统;杨国才通过对重庆市农业农村信息化云服务平台集成的关键技术进行研究,围绕云服务平台构建过程中的体系结构、信息标准、知识库、信息服务系统等关键模块进行设计,并以柑橘云服务平台为实例展开研究;文献则介绍了湖南农业信息化的研究进展情况,这些为加快湖南省农业农村信息化服务平台建设的新思路和新模式提供了参考,促进湖南省农业农村信息化快速发展。 然而受制于农户的文化水平及媒体传播途径,造成农业信息化发展地区差异大、快慢不均。在当前大数据技术快速发展情况下,可以利用可视化技术描述知识载体,更直观地挖掘、分析、构建、绘制和显示农业知识。 2.知识图谱绘制工具 知识图谱以知识为元素,能显示元素结构关系的一种工具,具有“图”和“谱”的双重特征,并且具有直观、定量、简单与客观等优点,是当前比较有效的、综合性的知识可视化分析方法和工具。毫无疑问用知识图谱展示农业知识是一种很好的工具,当前国外知识图谱的绘制工具有Citespace、Bibexcel、CopalRed、Workbench Tool、Science of science Tool、VOSViewer、SPSS等,其中主要的绘制工具有Citespace、Bibexcel。 1)CiteSpace是由美国陈超美教授基于JAVA平台开发的一款可视化文献分析软件,能够显示一个学科或知识域在一定时期发展的趋势与动向,形成若干研究前沿领域的演进历程。在第一代Citespace中,用户只能通过视觉观察找到网络中连接不同聚类的点,进而确定关键点。而Citespace II有了更好的优化,能用时间切片抓拍来显示研究领域的演变,使研究者较为容易地对科学领域进行定量和定性的研究。当前最新版本是Citespace III 3.9.R6(64-bit)。 2)Bibexcel也是一款非常好用的科学计量学研究软件,由瑞典科学计量学家Persson开发,可实现引文分析、被引分析及聚类分析等功能。提取多种知识单元及关系数据,并通过不同方法简化和规范数据,但它的可视化功能弱,常常用于知识可视化前期的数据预处理。网上能下载的最新版本是他退休前的2009年版本。 3.知识图谱构建方法进展 随着物联网、云计算技术等在我国迅速推广,数据过载现象已十分严重,因此如何挖掘出这些数据的价值显得格外重要。科学知识图谱可以很好地将数据分类,并通过可视化的方式展现出来。通过查阅知网、Springer等文献,可知国内外学者对知识图谱构建方法研究也同样如火如荼,利用的绘制工具主要有Citespace III、Ucinet、Bibexcel、SPSS等。 表1是国内近4年的研究进展。 表2是国外近4年的研究进展。 通过国内外知识图谱构建技术研究的对比分析,发现: ①国内知识图谱的研究力量主要集中于各地的高校,而国外知识图谱的研究力量则分布较为广泛。 ②国内外知识图谱普遍采用社会网络分析法、词频分析法、多元统计分析法、共引分析法、引文分析法等。 ③国内构建知识图谱主要侧重对一些学科的发展方向及目前发展的情况进行分析,国外知识图谱则更注重对一些社会热点进行分析。 ④国内利用知识图谱处理农业信息化数据,主要从2012年开始,这与科技部等3部委组织开始在全国进行农业信息化建设的步调是一致的。 4.湖南农业知识库研究进展 国家农业农村信息化示范省综合服务平台是由湖南省科技厅牵头组织,由湖南农业大学等单位实施。经过近3年的建设,农村信息化基础设施不断夯实,基层信息服务体系不断完善,湖南农村信息化服务水平不断提升。 在知识库建设方面,主要进展如下: 1)构建专业知识库30个,知识条目主要采用问答式和标签式,构建了基于对象关系模型的知识库,开发茶叶、生猪、水稻、油菜、柑桔等农业主导产业知识库,以及葡萄、金银花、猕猴桃、蔬菜、果树林、食用原料林、林化工业原料林、药用林、特种养殖、特种水产等特色产业知识库。当前知识库群知识条目累计总量超3万条。 2)农业百科作为农业知识库的门户,是展现、推广、传播农业知识的总窗口。主要根据农业知识分类,将专家经验、网络文献与书籍信息三种主要资源结合在一起,解决农业知识查询与农业知识咨询服务等问题。 从总体上看,本综合服务平台存放着大量农业知识,每天有许多呼叫记录入库,这些农业知识庞大,但做到信息完全相连相关还有难度,进行农业知识查询和分析时,一是词条过多,不知哪条更适合;二是查询不准,易造成财产损失;三是关联度不强,知识条目查询困难,因此需要直观的图谱化展示技术来解决这些农业知识相关联问题。 5.农业知识图谱构建策略 利用湖南省国家农村农业信息化示范省综合服务平台构建的以茶叶、生猪、水稻、油菜、柑桔等农业主导产业知识库,以及葡萄、金银花、猕猴桃、蔬菜、果树林、食用原料林、林化工业原料林、药用林、特种养殖、特种水产等特色产业知识库中的农业知识,并充分运用该平台中的农业百科对农业知识的分类来绘制农业知识图谱,同时借鉴电子地图对数据的多尺度表达思想,即当图形的缩放比率达到一定程度时,可以自动调阅该图上一级或下一级比例尺的地图,将该思想应用到农业知识图谱体系中,以综合服务平台上的知识库为数据源,将农业知识进行多维度表达,将农业知识图谱设计成与电子地图一样有很强层次感的检索工具。这样不仅可以使农业知识条目清晰,更重要的是它使得用户对农业知识的查询更加直观。图1给出农业知识图谱绘制过程,展示如何针对已有知识条目与零散的知识内容,搭建一个多尺度查询、快速展示的农业知识图谱系统。 6.结论 通过对国内外农业信息化相关领域及知识图谱的绘制工具、绘制构建方法比较分析,虽然农业知识图谱技术在国内的研究才刚刚起步,但随着湖南省国家农村农业信息化示范省综合服务平台的搭建与农业知识库群的构建,将会为用户提供简洁、直观的农业知识图谱系统,实现不同知识条目之间的关系、不同用户所关注问题的程度、不同时段呼叫中心热点跟踪等直观展示。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。