盲人英语自助学习中的字母图像自动识别方法优化
韩峰
摘 要: 采用字母图像的特征点检测方法进行信息标定,实现图像自动识别,为盲人进行英语自助学习提供向导。提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法,对原始的字母图像进行盲人视觉信息空间重构,对重构的图像进行小波分解,实现字母信息特征分布角点的检测;并采用小波三级提升分解实现图像信息增强,实现字母图像自动识别改进。仿真结果表明,采用该方法进行字母图像自动识别的准确度较高,提高了图像的输出信噪比及归一化配准度,可有效指导盲人英语自助学习。
关键词: 盲人; 英语学习; 图像自动识别; 特征点检测
中图分类号: TN911.73?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)12?0124?04
Abstract: The feature point detection method of letter image is used to calibrate the information to realize the image automatic recognition and guide the blind for English self?learning. A letter image automatic recognition method based on wavelet three?level lifting decomposition of alphabet corner component is proposed to reconstruct the vision information space of blind, and detect the feature distribution angular point of letter information. The wavelet three?level lifting decomposition is used to enhance the image information to improve the letter image automatic recognition. The simulation results show that the method has high accuracy for letter image automatic recognition, improves the output signal?to?noise ratio and normalized matching degree of the image, and can guide the blind for English self?learning effectively.
Keywords: blind; English learning; image automatic recognition; feature point detection
随着数字图像处理技术的发展,采用全息成像技术进行数字成像,转化为盲人的视觉空间可识别的图像,为盲人进行视觉信息重构提供可能性[1]。盲人在进行英语学习中,需要对字母全息成像图像进行视觉特征点的增强处理,通过特征点检测和信息增强,提升成盲人能识别的字母图像,进而有效指导英语学习,研究盲人英语自助学习中的字母图像自动识别方法,对提高盲人的英语学习水平,改善盲人英语学习的有效性方面具有重要的理论和实践意义。
1 字母图像信息增强预处理
1.1 字母图像盲人视觉信息空间重构
为了提高盲人进行英语自助学习的水平和可视化程度,本文提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法。对原始的字母图像进行盲人视觉信息空间重构[2?3],在4×4的像素块区域中,进行英语字母图像的全息成像,英语字母图像的块匹配区域在第i行及第j列的像素特征点信息描述为:
1.2 英文字母图像信息增强处理
在对原始的字母图像进行盲人视觉信息空间重构的基础上,对重构的图像进行小波分解,对图像分量进行骑士巡游运算[6],采用Daubechies 9/7小波三级提升分解方法[7?8],将英文字母图像进行R,G,B三色分离,获得相应的分量,,。根据奇异值分解得到英文字母图像骑士巡游逆运算结果,英文字母图像的信息分量分解的总过程如图1所示。
采用字母角点分量小波三级提升分解方法,进行图像的高频分解,对一维双正交9/7提升方案由两次预测和更新完成,设英文字母图像,待提升小波的小波反变换预测结果分别用奇数序列表示。设a,b,c,d为提升系数,对英文字母图像进行两轮更新和状态预测如下:
经过两轮预测和更新运算后,最终实现对英文字母图像信息增强处理。
2 字母图像识别实现
2.1 图像的小波三级提升分解
在上述进行了字母图像的信息增强处理的基础上,进行图像识别改进设计。本文提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法,对重构的图像进行小波分解,实现字母信息特征分布角点的检测。根据字母图像A和矢量量化后的图像W的R,G,B分量,相应得到,,和,,。对字母图像的高频分量进行置乱处理,得到点到线模型阶段图像的小波域子矢量,对原始图像分量进行Daubechies 9/7小波三级提升分解,在不同码书尺寸下进行Harris角点检测[9],按照图像的噪声强度进行三级提升小波反变换,将字母图像的信息分量,添加到图像的位置、尺度、主方向等信息素中,表示为,,得到字母图像主方向信息要素分量,。采用小波三级提升分解方法进行字母图像识别,小波三级提升分解过程如图2所示。
在盲人进行英语自助学习中,需要对字母图像分量,,进行视觉重构,得到字母图像的经过小波三级提升分解后的角点分量:
3 仿真实验分析
仿真建立在Matlab R2009a软件平台上,实验的硬件环境:CPU为Intel Core i3?370,主频2.93 GHz,字母图像的采集像素值为15×15,盲人进行英语学习中观察视觉方向为45°,为了测试图像识别的性能,采用图像的输出信噪比及归一化配准度为测试指标。其中,图像的输出信噪比反应的是图像的可识别度,归一化配准度也称相似性系数,用来度量数字图像识别的鲁棒性,计算公式分别为:
式中,和分别表示原始英文字母图像和提取出的字母图像特征信息。选取大小为210×210的256级英文字母图像作为原始图像,嵌入30×30的二值高斯色噪声,采用小波三级提升分解实现图像信息增强, 实现字母信息特征分布角点的检测和图像自动识别。图3为不同方法进行英文字母图像识别的归一化配准度。
分析图3结果得知,采用本文方法进行盲人英语自助学习中的字母图像识别,图像的归一化配准度较高,说明该方法的鲁棒性较好,提高了对图像的可识别能力。图4为图像识别的输出信噪比,从图4得知,本文方法进行图像识别的输出信噪比较高,说明识别的准确度较高、性能较好。
4 结 语
本文研究了英文字母图像的盲人自助学习识别方法,采用字母图像的特征点检测方法进行信息标定,实现图像自动识别,为盲人进行英语自助学习提供向导。本文提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法,对原始的字母图像进行盲人视觉信息空间重构,对重构的图像进行小波分解,实现字母信息特征分布角点的检测,采用小波三级提升分解实现图像信息增强,实现字母图像自动识别改进。仿真结果表明,采用该方法进行字母图像自动识别的准确度较高,提高了图像的输出信噪比及归一化配准度,有效指导盲人英语自助学习,具有一定的应用前景。
参考文献
[1] 孟春芝,何凯,焦青兰.自适应样本块大小的图像修复方法[J].中国图象图形学报,2012,17(3):337?341.
[2] 刘怀愚,李璟,洪留荣.利用局部特征的子空间车辆识别算法[J].计算机工程与应用,2010,46(30):156?180.
[3] 杨靖宇,张永生,邹晓亮,等.利用暗原色先验知识实现航空影像快速去雾[J].武汉大学学报(信息科学版),2010,35(11):1292?1295.
[4] 雷亮,汪同庆,杨波.图像关联规则挖掘研究[J].计算机应用研究,2009(6):2374?2376.
[5] 单家凌.基于无线网络车牌识别系统识别算法的研究[J].计算机测量与控制,2011,19(1):124?126.
[6] FAN N. Object classification and occlusion handling using quadratic feature correlation model and neural networks [J]. International journal of pattern recognition and artificial intelligence, 2011, 25(3): 287?298.
[7] CAND?S E J. Ridgelets: theory and applications [D]. New York: Stanford University, 1998.
[8] RAMESH S M, SHANMUGAM A. An efficient robust watermarking algorithm in filter techniques for embedding digital signature into medical images using discrete wavelet transform [J]. European journal of scientific research, 2011, 60(1): 33?44.
[9] TAO H, ZAIN J M, AHMED M M, et al. A wavelet?based particle swarm optimization algorithm for digital image watermarking [J]. Integrated computer aided engineering, 2012, 19(1): 81?91.
[10] CHOI J, YU K, KIM Y. A new adaptive component?substitution?based satellite image fusion by using partial replacement [J]. IEEE transactions on geoscience and remote sensing, 2011, 49(1): 295?309.
[11] HU A, ZHANG R, YIN D, et al. Image quality assessment using a SVD?based structural projection [J]. Signal processing: image communication, 2014, 29(3): 293?302.
摘 要: 采用字母图像的特征点检测方法进行信息标定,实现图像自动识别,为盲人进行英语自助学习提供向导。提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法,对原始的字母图像进行盲人视觉信息空间重构,对重构的图像进行小波分解,实现字母信息特征分布角点的检测;并采用小波三级提升分解实现图像信息增强,实现字母图像自动识别改进。仿真结果表明,采用该方法进行字母图像自动识别的准确度较高,提高了图像的输出信噪比及归一化配准度,可有效指导盲人英语自助学习。
关键词: 盲人; 英语学习; 图像自动识别; 特征点检测
中图分类号: TN911.73?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)12?0124?04
Abstract: The feature point detection method of letter image is used to calibrate the information to realize the image automatic recognition and guide the blind for English self?learning. A letter image automatic recognition method based on wavelet three?level lifting decomposition of alphabet corner component is proposed to reconstruct the vision information space of blind, and detect the feature distribution angular point of letter information. The wavelet three?level lifting decomposition is used to enhance the image information to improve the letter image automatic recognition. The simulation results show that the method has high accuracy for letter image automatic recognition, improves the output signal?to?noise ratio and normalized matching degree of the image, and can guide the blind for English self?learning effectively.
Keywords: blind; English learning; image automatic recognition; feature point detection
随着数字图像处理技术的发展,采用全息成像技术进行数字成像,转化为盲人的视觉空间可识别的图像,为盲人进行视觉信息重构提供可能性[1]。盲人在进行英语学习中,需要对字母全息成像图像进行视觉特征点的增强处理,通过特征点检测和信息增强,提升成盲人能识别的字母图像,进而有效指导英语学习,研究盲人英语自助学习中的字母图像自动识别方法,对提高盲人的英语学习水平,改善盲人英语学习的有效性方面具有重要的理论和实践意义。
1 字母图像信息增强预处理
1.1 字母图像盲人视觉信息空间重构
为了提高盲人进行英语自助学习的水平和可视化程度,本文提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法。对原始的字母图像进行盲人视觉信息空间重构[2?3],在4×4的像素块区域中,进行英语字母图像的全息成像,英语字母图像的块匹配区域在第i行及第j列的像素特征点信息描述为:
1.2 英文字母图像信息增强处理
在对原始的字母图像进行盲人视觉信息空间重构的基础上,对重构的图像进行小波分解,对图像分量进行骑士巡游运算[6],采用Daubechies 9/7小波三级提升分解方法[7?8],将英文字母图像进行R,G,B三色分离,获得相应的分量,,。根据奇异值分解得到英文字母图像骑士巡游逆运算结果,英文字母图像的信息分量分解的总过程如图1所示。
采用字母角点分量小波三级提升分解方法,进行图像的高频分解,对一维双正交9/7提升方案由两次预测和更新完成,设英文字母图像,待提升小波的小波反变换预测结果分别用奇数序列表示。设a,b,c,d为提升系数,对英文字母图像进行两轮更新和状态预测如下:
经过两轮预测和更新运算后,最终实现对英文字母图像信息增强处理。
2 字母图像识别实现
2.1 图像的小波三级提升分解
在上述进行了字母图像的信息增强处理的基础上,进行图像识别改进设计。本文提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法,对重构的图像进行小波分解,实现字母信息特征分布角点的检测。根据字母图像A和矢量量化后的图像W的R,G,B分量,相应得到,,和,,。对字母图像的高频分量进行置乱处理,得到点到线模型阶段图像的小波域子矢量,对原始图像分量进行Daubechies 9/7小波三级提升分解,在不同码书尺寸下进行Harris角点检测[9],按照图像的噪声强度进行三级提升小波反变换,将字母图像的信息分量,添加到图像的位置、尺度、主方向等信息素中,表示为,,得到字母图像主方向信息要素分量,。采用小波三级提升分解方法进行字母图像识别,小波三级提升分解过程如图2所示。
在盲人进行英语自助学习中,需要对字母图像分量,,进行视觉重构,得到字母图像的经过小波三级提升分解后的角点分量:
3 仿真实验分析
仿真建立在Matlab R2009a软件平台上,实验的硬件环境:CPU为Intel Core i3?370,主频2.93 GHz,字母图像的采集像素值为15×15,盲人进行英语学习中观察视觉方向为45°,为了测试图像识别的性能,采用图像的输出信噪比及归一化配准度为测试指标。其中,图像的输出信噪比反应的是图像的可识别度,归一化配准度也称相似性系数,用来度量数字图像识别的鲁棒性,计算公式分别为:
式中,和分别表示原始英文字母图像和提取出的字母图像特征信息。选取大小为210×210的256级英文字母图像作为原始图像,嵌入30×30的二值高斯色噪声,采用小波三级提升分解实现图像信息增强, 实现字母信息特征分布角点的检测和图像自动识别。图3为不同方法进行英文字母图像识别的归一化配准度。
分析图3结果得知,采用本文方法进行盲人英语自助学习中的字母图像识别,图像的归一化配准度较高,说明该方法的鲁棒性较好,提高了对图像的可识别能力。图4为图像识别的输出信噪比,从图4得知,本文方法进行图像识别的输出信噪比较高,说明识别的准确度较高、性能较好。
4 结 语
本文研究了英文字母图像的盲人自助学习识别方法,采用字母图像的特征点检测方法进行信息标定,实现图像自动识别,为盲人进行英语自助学习提供向导。本文提出一种基于字母角点分量小波三级提升分解的字母图像自动识别方法,对原始的字母图像进行盲人视觉信息空间重构,对重构的图像进行小波分解,实现字母信息特征分布角点的检测,采用小波三级提升分解实现图像信息增强,实现字母图像自动识别改进。仿真结果表明,采用该方法进行字母图像自动识别的准确度较高,提高了图像的输出信噪比及归一化配准度,有效指导盲人英语自助学习,具有一定的应用前景。
参考文献
[1] 孟春芝,何凯,焦青兰.自适应样本块大小的图像修复方法[J].中国图象图形学报,2012,17(3):337?341.
[2] 刘怀愚,李璟,洪留荣.利用局部特征的子空间车辆识别算法[J].计算机工程与应用,2010,46(30):156?180.
[3] 杨靖宇,张永生,邹晓亮,等.利用暗原色先验知识实现航空影像快速去雾[J].武汉大学学报(信息科学版),2010,35(11):1292?1295.
[4] 雷亮,汪同庆,杨波.图像关联规则挖掘研究[J].计算机应用研究,2009(6):2374?2376.
[5] 单家凌.基于无线网络车牌识别系统识别算法的研究[J].计算机测量与控制,2011,19(1):124?126.
[6] FAN N. Object classification and occlusion handling using quadratic feature correlation model and neural networks [J]. International journal of pattern recognition and artificial intelligence, 2011, 25(3): 287?298.
[7] CAND?S E J. Ridgelets: theory and applications [D]. New York: Stanford University, 1998.
[8] RAMESH S M, SHANMUGAM A. An efficient robust watermarking algorithm in filter techniques for embedding digital signature into medical images using discrete wavelet transform [J]. European journal of scientific research, 2011, 60(1): 33?44.
[9] TAO H, ZAIN J M, AHMED M M, et al. A wavelet?based particle swarm optimization algorithm for digital image watermarking [J]. Integrated computer aided engineering, 2012, 19(1): 81?91.
[10] CHOI J, YU K, KIM Y. A new adaptive component?substitution?based satellite image fusion by using partial replacement [J]. IEEE transactions on geoscience and remote sensing, 2011, 49(1): 295?309.
[11] HU A, ZHANG R, YIN D, et al. Image quality assessment using a SVD?based structural projection [J]. Signal processing: image communication, 2014, 29(3): 293?302.