基于数据挖掘的环境污染源数据智能审核技术系统的设计与实现
曾庆峰 梁岳
摘要:目前,污染源数据的智能审核系统仍旧以简单数学计算为基础,也有主要通过人工审核方式实现的技术系统。本次研究以数据挖掘为基础,分析了污染源智能监测的数据现场信息管理软件,并基本实现了数据预测的功能。因此本系统能够为环境保护等部门提供必要的参考数据。
关键词:数据挖掘;环境污染数据;智能审核
中图分类号:X502 文献标识码:A 文章编号:2095-672X(2018)06-0080-02
DOI:10.16647/j.cnki.cn15-1369/X.2018.06.048
Abstract: At present, the intelligent audit system for pollution source data is still based on simple mathematical calculations, and there are also technical systems that are mainly implemented through manual auditing. Based on data mining, this study analyzed the data on-site information management software for intelligent monitoring of pollution sources, and basically realized the function of data prediction. Therefore, this system can provide necessary reference data for environmental protection departments.
Keywords: Data mining; Environmental pollution data; Smart audit
近年來,我国经济的快速发展,取得了显著成绩,但与此同时,也导致越来越严重的污染,因此,需要更科学地针对污染治理项目制定详细高效的方案,实现污染监督管理的现代化。随着各项环保工作的开展,我国也逐渐建立起监测环境污染数据的相关体系及执法流程。也建立起一套以智能化污染源监测为基础的系统,该系统正在我国各地发挥作用,并取得了较好成绩。通过智能监测数据所得到的考核数据已经逐步成为评估企业污染排放量是否达标的重要依据。但环境检测系统也存在一定的局限性,容易受到客观环境的影响,使得相关数据可能存在一定的异常甚至丢失,因此会在一定程度上影响环境监管部门的判断。
1 系统需求
这一系统总共包含了以下5个模块,其中,数据编辑模块的主要功能为更新并删除数据库中的相关数据,用户管理模块则主要实现了用户注册和用户登录的功能,而智能审核模块则主要含有对数据补缺和对异常数据进行检测的功能[1]。
1.1 用户管理模块
为了确保系统安全性,避免非工作人员对数据进行篡改和盗用,用户模块实现了对登入网络用户进行身份验证的功能。用户管理模块主要的项目有用户注册和登录两种,新用户需要在注册时通过身份验证,而原有用户则需要输入正确的用户名和密码才能进入并访问系统并操作。
1.2 数据采集模块
数据采集模块主要功能为采集污染数据,并将采集到的数据保存至数据库。当用户于操作页面输入了污染源的有关数据信息后,信息就能被自动保存至相对应的数据库系统中,进而完成储存污染源信息数据的工作。
1.3 数据编辑模块
数据编辑模块的主要功能为修改污染数据,通过编辑的方式对数据进行相应处理,主要的处理项目包括数据更新和数据删除。污染源数据通常会大量占用存储空间,并且条目众多,因此操作者需要通过搜索关键词的方式找到具体数据信息并修改,同时可将过期的数据通过数据编辑模块删除[2]。
1.4 数据查询模块
数据调查模块的主要功能为查询污染源相关数据资料,通过条件查询的方式,数据调查模块能够实现高效定位,操作者可以在相应栏目输入污染代码、日期等关键条件,并以此进行关键信息的查找,将关联数据导出并制图,以供操作者直观地了解数据信息。可以选择将采集数据生成为折线图,而操作者可以根据图中信息发现污染源数据的变化规律[3]。
1.5 智能审核模块
智能审核模块是最重要的系统模块之一。该模块是基于数据挖掘智能审核技术的前提和基础条件,能够对向量计算法的数据予以补缺,实现以模糊聚类算法为基础的数据异常检测功能,并实现以BP神经网络算法为基础的数据预测功能[4]。上述所有功能都共同起到了对污染源数据进行查漏补缺的效果,准确监测污染源异常数据,从而对未来数天内的污染源数据予以预测。
2 系统设计
2.1 系统架构
首先是模型层:该层主要用于实现对系统数据的审核,通过控制层用户的请求,将对应数据调用后,通过数据挖掘的算法与污染源数据处理的方式,将所得数据信息通过折线图的形式展示,并呈现在用户界面以供读取和分析。
其次是视图层:视图层的核心内容为用户界面,用户注册、登录和查找数据信息功能均在这一界面中,除此之外还包括数据编辑功能、智能审核功能两个主要页面。视图层的主要作用为传递表单参数给用户,以便用户填写相关资料信息,并对用户搜索的结果予以显示[5]。
最后是视图层:对于来自视图层的用户请求,可以实现对模型层的调用,以实现相应的算法及功能,并且将污染源数据所处理得到的结果向视图层传递,并向用户展现。
2.2 数据库设计
在开发Web程序的过程中,常常会应用到JDBC系统,以帮助完成Web系统的数据库操作,同时JDBC技术需要以MVC架构为基础,以保证其可扩展性。数据表是用户注册的基础,主要用来将用户注册信息进行储存。而污水厂的排污量数据主要通过小时数据表实现,记录每时段的污染排放量[6]。
2.3 数据挖掘理论
首先是BP神经网络算法:人工神经网络的基础为数学模型,其建立在现代化的科研成果之上,主要原理类似于人类大脑对于数据信息的处理过程,并且和大脑特征也比较类似。具体算法为:①神经元之间能够传递信息,并对庞大数据进行处理;②容错性及健壮性强,如果出现少量的数据缺失,能够很好应对,并具有较好抗噪能力;③学习性及适应性,网络计算方法可以被简化为“输入-输出”或者“问题-答案”形式。关于BP神经网络,基本原理为:设定神经网络的输入样本,并将层节点数隐藏或输出。在隐含层将信号激活并放大,与此同时反向传输与期望信号的误差,通过误差信号对网格连接权值进行调整。最后在输出层将期望信号输出,并继续进行数据的预测处理。
2.4 系统模块设计
首先是公共模块的设计:在对软件进行开发的过程中,通常需要对公共模块予以应用,包括对于数据库的连接和对数据库的操作等等。编写数据库连接与操作类的主要方法包括连接数据库、查询关键词、更新内容、关闭数据库连接等等。其次是用户模块设计:应创建数据库,并相应分类,配置Servlet的名称等属性,在算法中实现对数据库的连接获准。只要用户能够正确填写信息并完成“注册”,则注册信息就能够被保存至数据库,用户即可完成注册。最后是数据库查询模块:在此模块下,工作人员能够实现对数据的查询,并寻找不同历史时期的数据变化趋势,并将其以折线图的方式生成,使历史数据的走向被更直观地表现出来。
3 系统实现
3.1 系统开发环境
本系统的开发是以数据挖掘环境的污染源数据智能审核技术为背景的,针对这一对象开展相关设计思路,以Web的B/S系统为基础,通过MVC模式框架实现。系统主要采用的是Java语言以及Tomcat服务器,数据库采用Server数据库,并使用了JavaScript相关技术。
3.2 系统模块功能
首先是用户管理模块:包括用户注册功能和用户登录功能、系统主页面等。用户注册需要用户填写用户名并输入登录密码,然后完成基本信息的填写;用户登录需要填写注册时的账号及密码,登录到系统页面后进行操作,如果用户忘记登录密码,可以通过密保手段或联系系统管理员解锁并重置密码;系统主页面包括数据编辑、数据查询、数据收集等功能,不同功能具有不同的作用,实现不同操作。系统还可以扩展如“友情链接”“最新动态”等功能。
4 结束语
对于污染源智能审核系统的设计,基本能够实现以数据挖掘为基础的智能审核技术补缺和异常检测,其中补缺功能的误差率控制在3%以内,而数据预测最大误差也能被控制在3%以内,极好的证明了这一系统的科学性及可靠性。
参考文献
[1]贺青.基于模糊聚类与BP神经网络的环境污染源数据的异常检测研究[D].银川:宁夏大学,2016.
[2]潘景全,李若玲,靳秀英等.河北省排污申报智能监管信息系统[Z].河北省环境信息中心,2013.
[3]陕西省危险废物管理信息系统[Z].陕西省固体废物管理中心,2011.
[4]钮卿,程琳.基于环境保护大数据的监测与智能诊断研究[J].环境科学与管理,2018,(1):167-170.
[5]何为.中国石油污染源在线监测系统发展的探究[J].油气田环境保护,2017,(4):44-45,48.
[6]曹科研,栾方军,孙焕良等.不确定数据基于密度的局部异常点检测[J].计算机学报,2017,(10):2231-2244.
收稿日期:2018-04-26
作者簡介:曾庆峰(1985-),男,研究生,助理工程师,研究方向为环境信息化相关工作。
摘要:目前,污染源数据的智能审核系统仍旧以简单数学计算为基础,也有主要通过人工审核方式实现的技术系统。本次研究以数据挖掘为基础,分析了污染源智能监测的数据现场信息管理软件,并基本实现了数据预测的功能。因此本系统能够为环境保护等部门提供必要的参考数据。
关键词:数据挖掘;环境污染数据;智能审核
中图分类号:X502 文献标识码:A 文章编号:2095-672X(2018)06-0080-02
DOI:10.16647/j.cnki.cn15-1369/X.2018.06.048
Abstract: At present, the intelligent audit system for pollution source data is still based on simple mathematical calculations, and there are also technical systems that are mainly implemented through manual auditing. Based on data mining, this study analyzed the data on-site information management software for intelligent monitoring of pollution sources, and basically realized the function of data prediction. Therefore, this system can provide necessary reference data for environmental protection departments.
Keywords: Data mining; Environmental pollution data; Smart audit
近年來,我国经济的快速发展,取得了显著成绩,但与此同时,也导致越来越严重的污染,因此,需要更科学地针对污染治理项目制定详细高效的方案,实现污染监督管理的现代化。随着各项环保工作的开展,我国也逐渐建立起监测环境污染数据的相关体系及执法流程。也建立起一套以智能化污染源监测为基础的系统,该系统正在我国各地发挥作用,并取得了较好成绩。通过智能监测数据所得到的考核数据已经逐步成为评估企业污染排放量是否达标的重要依据。但环境检测系统也存在一定的局限性,容易受到客观环境的影响,使得相关数据可能存在一定的异常甚至丢失,因此会在一定程度上影响环境监管部门的判断。
1 系统需求
这一系统总共包含了以下5个模块,其中,数据编辑模块的主要功能为更新并删除数据库中的相关数据,用户管理模块则主要实现了用户注册和用户登录的功能,而智能审核模块则主要含有对数据补缺和对异常数据进行检测的功能[1]。
1.1 用户管理模块
为了确保系统安全性,避免非工作人员对数据进行篡改和盗用,用户模块实现了对登入网络用户进行身份验证的功能。用户管理模块主要的项目有用户注册和登录两种,新用户需要在注册时通过身份验证,而原有用户则需要输入正确的用户名和密码才能进入并访问系统并操作。
1.2 数据采集模块
数据采集模块主要功能为采集污染数据,并将采集到的数据保存至数据库。当用户于操作页面输入了污染源的有关数据信息后,信息就能被自动保存至相对应的数据库系统中,进而完成储存污染源信息数据的工作。
1.3 数据编辑模块
数据编辑模块的主要功能为修改污染数据,通过编辑的方式对数据进行相应处理,主要的处理项目包括数据更新和数据删除。污染源数据通常会大量占用存储空间,并且条目众多,因此操作者需要通过搜索关键词的方式找到具体数据信息并修改,同时可将过期的数据通过数据编辑模块删除[2]。
1.4 数据查询模块
数据调查模块的主要功能为查询污染源相关数据资料,通过条件查询的方式,数据调查模块能够实现高效定位,操作者可以在相应栏目输入污染代码、日期等关键条件,并以此进行关键信息的查找,将关联数据导出并制图,以供操作者直观地了解数据信息。可以选择将采集数据生成为折线图,而操作者可以根据图中信息发现污染源数据的变化规律[3]。
1.5 智能审核模块
智能审核模块是最重要的系统模块之一。该模块是基于数据挖掘智能审核技术的前提和基础条件,能够对向量计算法的数据予以补缺,实现以模糊聚类算法为基础的数据异常检测功能,并实现以BP神经网络算法为基础的数据预测功能[4]。上述所有功能都共同起到了对污染源数据进行查漏补缺的效果,准确监测污染源异常数据,从而对未来数天内的污染源数据予以预测。
2 系统设计
2.1 系统架构
首先是模型层:该层主要用于实现对系统数据的审核,通过控制层用户的请求,将对应数据调用后,通过数据挖掘的算法与污染源数据处理的方式,将所得数据信息通过折线图的形式展示,并呈现在用户界面以供读取和分析。
其次是视图层:视图层的核心内容为用户界面,用户注册、登录和查找数据信息功能均在这一界面中,除此之外还包括数据编辑功能、智能审核功能两个主要页面。视图层的主要作用为传递表单参数给用户,以便用户填写相关资料信息,并对用户搜索的结果予以显示[5]。
最后是视图层:对于来自视图层的用户请求,可以实现对模型层的调用,以实现相应的算法及功能,并且将污染源数据所处理得到的结果向视图层传递,并向用户展现。
2.2 数据库设计
在开发Web程序的过程中,常常会应用到JDBC系统,以帮助完成Web系统的数据库操作,同时JDBC技术需要以MVC架构为基础,以保证其可扩展性。数据表是用户注册的基础,主要用来将用户注册信息进行储存。而污水厂的排污量数据主要通过小时数据表实现,记录每时段的污染排放量[6]。
2.3 数据挖掘理论
首先是BP神经网络算法:人工神经网络的基础为数学模型,其建立在现代化的科研成果之上,主要原理类似于人类大脑对于数据信息的处理过程,并且和大脑特征也比较类似。具体算法为:①神经元之间能够传递信息,并对庞大数据进行处理;②容错性及健壮性强,如果出现少量的数据缺失,能够很好应对,并具有较好抗噪能力;③学习性及适应性,网络计算方法可以被简化为“输入-输出”或者“问题-答案”形式。关于BP神经网络,基本原理为:设定神经网络的输入样本,并将层节点数隐藏或输出。在隐含层将信号激活并放大,与此同时反向传输与期望信号的误差,通过误差信号对网格连接权值进行调整。最后在输出层将期望信号输出,并继续进行数据的预测处理。
2.4 系统模块设计
首先是公共模块的设计:在对软件进行开发的过程中,通常需要对公共模块予以应用,包括对于数据库的连接和对数据库的操作等等。编写数据库连接与操作类的主要方法包括连接数据库、查询关键词、更新内容、关闭数据库连接等等。其次是用户模块设计:应创建数据库,并相应分类,配置Servlet的名称等属性,在算法中实现对数据库的连接获准。只要用户能够正确填写信息并完成“注册”,则注册信息就能够被保存至数据库,用户即可完成注册。最后是数据库查询模块:在此模块下,工作人员能够实现对数据的查询,并寻找不同历史时期的数据变化趋势,并将其以折线图的方式生成,使历史数据的走向被更直观地表现出来。
3 系统实现
3.1 系统开发环境
本系统的开发是以数据挖掘环境的污染源数据智能审核技术为背景的,针对这一对象开展相关设计思路,以Web的B/S系统为基础,通过MVC模式框架实现。系统主要采用的是Java语言以及Tomcat服务器,数据库采用Server数据库,并使用了JavaScript相关技术。
3.2 系统模块功能
首先是用户管理模块:包括用户注册功能和用户登录功能、系统主页面等。用户注册需要用户填写用户名并输入登录密码,然后完成基本信息的填写;用户登录需要填写注册时的账号及密码,登录到系统页面后进行操作,如果用户忘记登录密码,可以通过密保手段或联系系统管理员解锁并重置密码;系统主页面包括数据编辑、数据查询、数据收集等功能,不同功能具有不同的作用,实现不同操作。系统还可以扩展如“友情链接”“最新动态”等功能。
4 结束语
对于污染源智能审核系统的设计,基本能够实现以数据挖掘为基础的智能审核技术补缺和异常检测,其中补缺功能的误差率控制在3%以内,而数据预测最大误差也能被控制在3%以内,极好的证明了这一系统的科学性及可靠性。
参考文献
[1]贺青.基于模糊聚类与BP神经网络的环境污染源数据的异常检测研究[D].银川:宁夏大学,2016.
[2]潘景全,李若玲,靳秀英等.河北省排污申报智能监管信息系统[Z].河北省环境信息中心,2013.
[3]陕西省危险废物管理信息系统[Z].陕西省固体废物管理中心,2011.
[4]钮卿,程琳.基于环境保护大数据的监测与智能诊断研究[J].环境科学与管理,2018,(1):167-170.
[5]何为.中国石油污染源在线监测系统发展的探究[J].油气田环境保护,2017,(4):44-45,48.
[6]曹科研,栾方军,孙焕良等.不确定数据基于密度的局部异常点检测[J].计算机学报,2017,(10):2231-2244.
收稿日期:2018-04-26
作者簡介:曾庆峰(1985-),男,研究生,助理工程师,研究方向为环境信息化相关工作。