海量弱关联图像数据的检测系统设计与实现

李冰+毛布+许然



摘 要: 当前设计的图像数据检测系统大都依据特定关键词完成数据检测,对海量弱关联图像数据的检测效率和精度较低。为了解决这些问题,设计基于PMML规范的海量弱关联图像数据检测系统,其将数据检测算法同PMML标准融合,由表示层、应用服务层和数据资源层构成。其中应用服务层中的数据检测模块将形成的检测模型通过PMML文档输出,模型应用模块通过PMML模型采用自定义的数据检测查询语言CMQL完成语言检索,实现海量弱关联图像数据的有效检测。系统实现部分给出了PMML模型的创建和应用过程。实验结果表明,所设计检测系统具有较高的检测性能和较低的虚警率。
关键词: 海量弱关联图像数据; PMML; CMQL; 数据检测系统
中图分类号: TN911.73?34; TN453 文献标识码: A 文章编号: 1004?373X(2017)08?0114?03
Design and implementation of massive weak?correlation image data detection system
LI Bing1, MAO Bu2, XU Ran3
(1. Department of Information Technology, Sichuan Business Vocational College, Chengdu 610091, China;
2. Zigong Radio & TV University, Zigong 643000, China; 3. Zhejiang Sci?Tech University, Hangzhou 310018, China)
Abstract: The currently?designed image data detection systems detect the data mostly according to the specific keywords, and have low detection efficiency and precision for the massive weak?correlation image data. In order to solve these problems, a massive weak?correlation image data detection system based on PMML standard was designed, which fused the data detection algorithm with the PMML standard. The system is composed of the presentation layer, application service layer and data resource layer. The data detection module of the application service layer outputs the formed detection model through the PMML document. The model application module uses the self?defined data to detect the query language CMQL through PMML model for language retrieval, so as to detect the massive weak?correlation image data effectively. The creation and application process of the PMML model is given in the fourth part of this paper. The experimental results indicate that the detection system has high detection performance and low false alarm rate.
Keywords: massive weak?correlation image data; PMML; CMQL; data detection system
随着现代制造工业的高速发展,图像检测技术也快速发展。图像检测技术在医疗、军事、农业等领域具有广泛的应用价值。但是传统图像数据检测方法在较多领域已无法满足现代制造业的需求[1?3]。并且以往的图像数据检测系统大都依据特定关键词完成数据检测,对海量弱关联图像数据的检测效率和精度较低。因此,寻求有效的海量弱关联图像数据检测方法,具有重要应用意义。
1 海量弱关联图像数据检测系统
1.1 系统总体结构设计
本文设计的基于PMML规范的海量弱关联图像数据检测系统[4?6],其将数据检测算法同PMML标准融合,通过组件技术,增强系统的扩展性。该系统使用PMML语言规范,PMML模型是系统中各模块间和系统同其他检测系统间沟通的纽带。数据检测模块将形成的检测模型通过PMML文档输出,模型应用模块通过PMML模型完成语言检索。系统采用三层架构,如图1所示。
1.2 系统基本模块设计
(1) 预处理模块获取DICOM文件信息以及图像特征,同时形成数据表信息,并对图像数据进行离散化处理。
(2) CTM文件转换部件进行数据检测的数据源格式具有多样化特征,该部件解决了不同数源格式的差异性,确保为数据检测算法提供统一的数据格式。CTM文件转换部件将用户库中有价值的数据表变换成检测系统可分析的CTM格式。
(3) CMQL语法解析部件用于对数据检测任务进行设置。系统中的用户采用图形用户界面GUI表明待检测的对象,系统则可自主将检测任务变换成CMQL语句,同时传递给CMQL语法解释部件。该部件对检测任务中的待检测对象也就是CTM文件或图像数据表是否存在、检测算法是否存在和待检测对象是否满足检测算法的需求等进行检测。如果发现异常,则将错误信息传输给用户。如果检测对象满足检测需求,则将该语句解析成数据检测模块可分析的参数,并且将参数反馈给数据检测模块。
(4) 数据检测模块是系统的关键模块,可运行相应的图像数据检测任务。该模块采集CMQL語法解析部件反馈的不同检测参数,再按照检测参数选择合理的检测算法。也就是检测算法模块检索用户选择的检测算法对应的aass文件或JAR包。如果检索成功,则将检索参数反馈给检测算法模块中相关的类文件。
(5) 数据检测算法模块,通过哈希映射对图像数据检测算法进行控制。
2 PMML模型应用框架设计
2.1 PMML模型的塑造
PMML模型的塑造流程如图2所示,详细过程为:
(l) 用户采用客户端程序获取塑造PMML模型需要的数据表,采用CTM变换其将数据表转换成.cttn文件。
(2) 采集有价值的数据集,同时对其进行预操作。
(3) 选择合理的图像数据检测算法并设置其中的参数,并自主产生对应的CMQL语句。
(4) 分析CMQL语句,对弱关联图像数据检测任务进行分析,同时将检测任务以及对应的参数反馈给数据检测模块。
(5) 完成海量弱关联图像数据的检测后,将检测结果反馈给用户,同时将系统检测模型反馈给PMML模块。
(6) PMML模块进行模型变换,将检测模型变换成PMML模型并输出。
2.2 PMML模型的应用
PMML模型的应用流程如图3所示,其具体描述如下:
(1) 用户在客户端应用程序设置塑造PMML模型需要的数据表,采用CTM变换部件将数据表变换成.Ctln文件。
(2) 选择需要进行预测的数据集,同时对数据集进行预操作。
(3) 选择进行海量弱关联图像数据检测需要的PMML模型。
(4) 系统自主产生相关的CMQL语句。
(5) 分析CMQL语句,检测对应的PMML模型能否生成海量弱关联图像数据的检测任务。
(6) 数据检测模块将PMML模型作用在用户选取的数据集,同时将弱关联图像数据反馈给用户,而将模型的应用结果反馈给数据源。
3 实验分析
为了验证本文设计的海量弱关联图像数据检测系统的有效性,采用实际的AVIRIS高光谱数据源进行实验分析。AVIRIS是通过推扫成像方式的成像光谱仪,在0.3~2.23脚的波长区间采集224个波长处的空间图像信息,波长的间隔是8 nm。实验采用的图像是某地区机场的局部区域,使用的实验图像大小是100×100,其中含有30个需要检测的图像数据。实验采用的目标图像如图4所示。
实验分别采用本文方法和基于正交子空间的图像数据检测方法对实验图像进行检测,检测结果分别如图5和图6所示。
对比分析图5和图6的检测结果可得,本文方法的检测性能优于基于正交子空间的图像数据检测方法。因为基于正交子空间的图像数据检测方法未考虑不同图像数据间的关联性,形成较多的虚警。而本文方法的检测结果较为清晰、准确。为了进一步验证本文方法的优越性,将图像数据检测方法检测到的目标数量、目标占据的像素数、虚警占据的像素数和运算时间四个指标,当成评估本文方法和基于正交子空间的图像数据检测方法性能的指标。具体的结果如表1所示。从表1可以看出,本文方法具有较高的目标检测率和较低的虚警率,比基于正交子空间的图像数据检测方法的优越性好。
系统的图像数据接收特性可以反映不同环境下的检测概率和虚警概率间的波动关系,可对检测系统进行定量分析。检测概率为检测到的实际目标图像数据数量同地面实际目标图像数据量的比值;虚警概率为检测到的虚警图像数据量同总体图像数据量的比值。分析检测到的图像数据是否落入实际目标排列区域能够判断到检测到的是实际目标还是虚警。本文方法和基于正交子空间的图像数据检测方法的接收特性曲线如图7所示。从图7中能够看出本文方法的检测性能和虚警率都优于基于正交子空间的图像数据检测方法,较好地约束了混合图像像素中背景数据对图像数据检测的干扰。
4 结 论
为了解决以往的图像数据检测系统对海量弱关联图像数据存在的检测效率和精度较低问题。本文设计基于PMML规范的海量弱关联图像数据检测系统,其将数据检测算法同PMML标准融合,由表示层、应用服务层和数据资源层构成。其中应用服务层中的数据检测模块将形成的检测模型通过PMML文档输出,模型应用模块通过PMML模型采用自定义的数据检测查询语言CMQL完成语言检索,实现海量弱关联图像数据的有效检测。
参考文献
[1] 马亚楠,黄敏,李艳华,等.基于能量信息的毛豆豆荚螟高光谱图像检测[J].食品工业科技,2014,35(14):59?63.
[2] 陈健沛,朱炜湛,蔡志岗.红外监控图像红眼检测与消除[J].现代电子技术,2015,38(17):65?67.
[3] 韩先平.光电经纬仪图像数据内同步动态检测方法[J].自动化技术与应用,2016,35(2):96?99.
[4] 刘绥美,李鹏飞,张蕾,等.基于稀疏编码字典学习的疵点检测[J].西安工程大学学报,2015,29(5):594?599.
[5] 唐天翼,朱长仁,赵和鹏.基于色彩空间变换与异常检测的多光谱舰船感兴趣区域检测[J].现代电子技术,2015,38(21):28?31.
[6] 张军,王勇,郝万兵.面部彩色图像特征检测方法研究[J].软件导刊,2015,14(9):166?168.