网站首页  词典首页

请输入您要查询的论文:

 

标题 基于领域本体的农药信息智能查询系统设计
范文

    王翔宇 李永浩 穆润泽

    [摘? ? 要] 为了方便广大农业生产人员和农业知识学习人员可以通过包括语义查询等方式查询农作物信息、农药信息以及根据中毒症状查询对应农药和相应解毒方法,本文设计了一种基于领域本体,利用数据库技术、中文分词技术,以SSH框架搭建的基于B/S结构的农药信息智能查询系统。

    [关键词] 领域本体;中文分词;农药信息;智能查询

    doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 17. 066

    [中图分类号] TP311? ? [文献标识码]? A? ? ? [文章编号]? 1673 - 0194(2020)17- 0153- 02

    1? ? ? 引? ? 言

    在现代农业中作物的生产安全和生产效率都极为重要。在病虫害防治工作中,对于不同作物的特定疾病及时选择合适的农药种类,并了解安全合理的使用方法以及相关安全性方面的信息,这对于提高农业生产效率和经济收益以及确保农药的安全使用有着极为重要的影响。由于缺乏对信息资源的统一表述,这使得传统检索系统经常无法准确理解用户的表达,这也就使得语义信息的资源共享变得难以实现[1]。用户获取所需准确信息的难度和查找时间大大增加,尤其对于像农药中毒的解毒处理这种紧急情况每一秒都显得至关重要。所以利用本体技术来构建一个WEB端的操作简便、体系完善和基于语义查询的农药信息智能查询系统就显得尤为重要和迫切,既能方便广大农业生产人员对于病虫害和农药中毒的处理,又能为其他农业相关人员提供一定的参考和学习。

    2? ? ? 系统总体设计

    本农药信息智能查询系统的主要功能有以下四大模块组成:农作物和农药信息浏览模块、智能查询模块、信息管理模块和用户意见反馈模块。农作物和农药信息浏览模块实现用户对系统的全部信息浏览,可以随意查看经过整理后的农药信息库和作物信息库中农药和农作物的具体信息以及分类情况,目录可折叠以方便用户更方便地对信息进行浏览和对比。智能查询模块用于实现用户对农药信息和农作物信息的查询以及对中毒急救查询,其中在对农药信息和农作物信息进行查询时分为农药使用查询和分类情况查询两种查询方式,在进行农药使用查询时用户可以选择输入农药名称、作物名称、毒性、疾病名称、使用方法中的一种对农药使用信息进行查询,而查询到的结果包含农药名、毒性、针对作物、针对疾病、使用剂量、使用方法,可以点击查询结果中的农药名以查看农药的详细信息包括产品功能及参数、注意事项、急救措施和其他信息四项。

    系统访问农药信息数据库,结合领域本体数据库(分为农药本体和农作物本体)中的关系信息,通过 Web 端来向用户提供农作物类别、农药的使用方法、毒性、解毒方法及其他相关信息。市面上的农药会更新换代,系统管理人员每隔一段时间就需要根据用户的合理反馈和實际情况对系统内的信息作出必要的更新。领域本体的构建和中文分词技术是基于领域本体的农药信息智能查询系统的核心组成部分。在查询时,输入的作物名称可以是等价的别名,虽然农药信息数据库中没有作物的别名信息,但与数据库关联的本体文件当中存在作物的多个等价别名,例如用户输入“西红柿”或“洋柿子”进行查询时,查询到的结果是“番茄”所对应的信息。信息管理模块主要实现对农药和作物信息的管理,由系统管理员进行增删改查操作,修改时只需修改本体文件和农药信息数据库即可。用户意见反馈模块实现用户登录后向管理员发送意见信息,比如信息的更新删减和功能上的建议,这有助于进一步了解到用户详细需求和系统需要改进之处。

    2.1? ?系统详细设计

    要完成本系统的设计,首先要建立一个农业科学领域本体库( 或知识库) ,这是最核心最关键的部分之一,这样在此基础上才能实现对农业信息知识的Web页面自由检索[2]。关于本体(Ontology)的定义,学术界较广为认可的是Studer等人对Gruber的定义进行的扩展“本体是共享概念模型的明确的形式化规范说明[3]”。本体对领域知识在语义层次上作出了相关描述,使领域知识在能够被人类理解的基础之上更能被机器所识别和处理。按照本体对领域的依赖程度强弱,可以分为:顶层本体、领域本体、任务本体以及应用本体。领域本体用于描述指定领域知识,它对领域实体概念及相互关系领域话动以及该领域所具有的特性和规律做出了一种形式化的专业描述[4]。如农业领域、医学领域、军事领域等。这里的 “领域”是根据本体构建者的自身需求来确立详细范围的,领域可以是一个学科领域,也可以是某几个学科领域的一种结合等等。本体的创建是个相当耗费时间和精力的过程[5],方式分为手工构建、半自动构建和自动构建这三种,现在真正意义上的自动构建本体技术尚未出现,手工建库虽然更加准确但也更加耗费精力且工作周期更长,根据本系统的需求选择的是半自动构建本体的方法。具体选择的是斯坦福大学医学院开发的“七步法”,这种方法主要用于领域本体尤其是医学方面领域本体的构建。这七步分别为:①确定本体的领域范围;②考虑能否复用现有本体;③列出本体中的主要概念术语;④定义类和类之间的层次关系(完善层次关系的方法有:自顶向下法、自底向上法和综合法);⑤定义类的属性关系;⑥定义属性的约束;⑦创建实例[6]。本系统在中国农业出版社出版的《农业科学叙词表》的基础之上进行半自动构建农作物领域本体,本体构建的工具是Protégé,与其他本体构建工具相比,Protégé是为数不多支持中文构建的软件,用Graphviz插件即可实现中文关系的显示。《农业科学叙词表》虽然相对比较权威但其时间较久,但有些内容略显过时,故需要按照系统需求通过网络爬虫技术爬取各大权威百科网站和农业信息网站的信息,并加以筛选,将以上数据整理为结构化数据后再利用Jena包编写程序对存储农作物本体的OWL文件进行导入、修改等操作,农药领域本体的构建也大致相同。

    2.2? ?数据库设计

    作为开发中小型网站时的首选,MySQL是在WEB应用这一方面最好的关系数据库管理系统之一[7]。在实际的生产生活中,农药和作物病虫害是多对多的关系。故需要把实体和关系分离并单独建表,实体表为农药表和作物表,关系表为农药作物关系表,共由三个表组成,其中关系表采用联合主键(由作物表主键和农药表主键组成)的方式建表。农药表主要储存农药的包括名称、针对疾病、使用方法、使用剂量、毒性、解毒方法等信息。作物表主要储存作物名称、科属、子品种信息。而农药作物关系表储存的是农药和作物之间的对应关系。

    3? ? ? 中文分词系统用户词典的构建

    所谓分词是指将一个文字序列按照某种规则和规范进行分割并重新组合成一个新的词序列的过程[8]。相比于英语等词汇间有明显间隔的字母文字,中文分词的词汇准确分割的实现更为困难。中文分词指将一个汉字序列切分成一个个单独的词。本系统所需实现的是农药中毒急救查询功能,如果已知农药名称即可输入农药名称来查询农药的具体信息包括中毒急救方法,如果不知道农药名称则可输入中毒症状,通过中文分词系统处理,查询出所需结果,在用户输入几种症状时系统会有多个查询结果并按特征词相关程度排列以备用户对照查看具体信息来确定最为可能中毒的农药以及相应的急救措施。本中文分词功能采用由中国科学院计算技术研究所研制的汉语词法分析系统[9](NLPIR-ICTCLAS),这一系统主要功能有中文和英文分词;词性标注;关键词提取;新词识别以及命名实体识别[10]。这一系统支持用户专业词典、多种编码、多种操作系统、多种开发语言与平台,能够在线分词或者根据官网提示下载工具包,用户可以按照自身需求修改自定义用户词典,添加自定义词语和词性等。对于本系统用户词典的构建,首先根据系统需求统计网络上和日常生活中对中毒后急救的提问方式,去停用词、抽取关键词、整合并标注词性、划分同义词,结合专业名词和用户对中毒急救的提问方式的统计制作出分词系统的用户词典,系统提取多个特征关键词后进行查询匹配,按照语义相关度列出查询结果。

    4? ? ? 系统总结

    针对市面上现有的農药信息查询系统缺乏语义查询、信息零散,缺乏不明农药中毒急救查询等问题,本文设计了一种基于领域本体的农药信息智能查询系统。通过建立农药和作物领域本体和农药信息数据库,将农药和作物信息系统化、关联化,以提高系统查询效率和智能程度;以网页作为载体,方便了大多数人的使用,采用中文分词系统实现了对农药中毒急救的查询。定期更新和补全农药信息、作物品种,用户还可以向系统管理人员反馈系统改进建议和信息更新等需求,力求实现对用户长期负责的系统服务,使得系统更加完善、准确和可靠。

    主要参考文献

    [1]李朝印.基于本体的语义检索技术研究与实现[D].西安:西安电子科技大学,2014.

    [2]苏玉宁,姜艺,陈贺胜,等.基于Ontology 的农业科学领域知识库构建[J].江苏农业科学,2018,46(5):194-198.

    [3]Studer R, Benjamins V R, Fensel D.Knowledge Engineering,Principles and Methods[J]. Data and Knowledge Engineering. 1998,25(122):161-197.

    [4]李勇,张志刚.领域本体构建方法研究[J]. 计算机工程与学,2008,30(5):129-131.

    [5]郑颖,金松林,张自阳.基于领域本体的农作物病虫害问题分类研究[J].江苏农业科学,2016,44(9):145-148.

    [6]游宇.基于本体的科技资源搜索引擎设计与实现[D].上海:复旦大学,2009.

    [7]严明.明清古建筑信息系统的研究设计与实现[D].西安:西安建筑科技大学,2016.

    [8]高健明.基于多源数据融合的微博用户兴趣挖掘方法[D].哈尔滨:哈尔滨工业大学,2016.

    [9]孙铁利,刘延吉.中文分词技术的研究现状与困难[J].信息技术,2009(7): 187-189.

    [10]马扬.基于语义的中文文本自动分类系统的研究与实现[D].重庆:重庆大学,2009.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/15 6:30:02