标题 | 基于HALCON的票据字符提取系统设计与实现 |
范文 | 彭继彬+陈晓荣 摘要:票据特殊字符提取识别工作量大、效率低。针对该问题,以HALCON作为机器视觉和图像处理核心软件,将计算机视觉检测技术应用于票据的特定字符识别,包括阈值分割、填充缝隙与滤波、图像分割和ORC图像处理等图像处理关键技术,实现图像采集、预处理和检测识别。 关键词:字符提取;HALCON;机器视觉;图像处理 中图分类号:TP319 文献标识码:A 文章编号:16727800(2017)004008003 0引言 我国专利申请量居世界前列,每年都有数以百万项专利申请。专利号是每个专利的唯一标识,数目繁多,统计工作量巨大,人工管理专利作业不仅效率低,还容易出错。因此,设计一种自动识别专利发票上的专利申请号系统十分必要。本文以专利发票为实验对象,介绍一种票据字符提取系统。 随着计算机技术和数字图像处理技术的飞速发展,机器视觉广泛应用于生产生活中。视觉检测技术作为机器视觉的重要研究领域,不仅能提高自动化程度,还能显著提升检测的安全性与可靠性[1]。当今几乎所有需要人类视觉的场合都可以用机器视觉技术来代替,尤其对于需要快速、重复地从图像中获取精确信息的场合,机器视觉技术是实现计算机集成制造的基础技术[23]。 HALCON是德国MVtec公司开发的具有强大图像处理功能的软件,包含所有标准和高级的图像处理方法,拥有非常完善的函数库,包括定位、匹配、识别等高级算法,能够进行图像获取、模板匹配、Blob分析、边缘提取、测量、识别等[4],具有全面的视觉处理库和应用广泛的机器视觉集成开发环境。HALCON通过交互编程开发应用程序,或加入新的算子来实现视觉功能,是应用效果最好的机器视觉处理软件[2,5]。本文利用HALCON机器视觉技术设计并实现票据特定字符——专利申请号的提取。 1系统设计 基于机器视觉的专利收费票据检测系统需要对置物台上的专利收费票据进行采集和识别,最终提取出申请号字符。申请号字符提取系统主要由电源光源部分、攝像机传感器单元、图像采集单元和图像处理操作平台等构成。通过调节器控制光源,摄像机传感器和图像采集单元由检测元件控制。系统架构如图1所示。 系统流程如图2所示。 申请号字符提取系统中,用CMOS数字像机进行图像采集,图像采集单元主要完成置物台上整个票据图像的获取。图像采集和处理是机器视觉系统的核心,摄像机获取的图像包含了需要的所有信息,图像质量的好坏将直接影〖HJ*3〗响系统检测效率和精度,是整个机器视觉系统的关键。光源则影响整个图像质量,合适的光源能很好地区分目标信息和背景信息,影响输入图像的质量和至少30%的应用效果[6]。根据应用需求,系统光源采用LED光源。系统工作时,采用检测触发抓拍方式获取图像,摄像机由检测元件触发控制。检测元件由光电触发器与反射板组成,它是一个反射型的触发器。当票据通过置物台时,信号强度会变化,检测元件据此输出控制信号来触发摄像机拍摄图像[7]。拍摄的图像传送到采集单元,再经过像机数据接口传输到机器视觉图像库中,利用软件中的算子功能对图像进行相应处理、识别和输出。机器视觉软件为HALCON 10.0。 2图像处理技术 采用 OCR图像处理方法检测专利收费票据申请号字符。OCR指通过图像处理和模式识别技术对光学字符进行识别,用于阅读和识别特定区域字符。基于模板机制,针对不同票据,定制不同的识别要素,专利票据为印刷票据,因此采用OCR图像处理方法对票据申请号字符进行提取,基本步骤为:获取图像→预处理图像→分割图像→OCR匹配→识别字符→输出结果。 2.1获取图像 图像获取由摄像机传感器、检测元件等硬件设备和HALCON软件算子共同完成,HALCON软件首先调用open_framegrabber算子访问图像采集设备,再调用grab_image算子完成采集图像,将采集得到的图像加以保存,然后再调用read_image和dev_display把图像显示出来。票据图像如图3所示。 2.2预处理图像 为使采集的图像区域特征更加明显,目标信息更加突出,要经过一系列预处理,主要有图像增强、灰度值调节、滤波、填充缝隙、图像分割等[7]。 2.2.1图像增强与灰度值调整 调用emphasize算子,使发票上的信息显示更为明显。为了得到更清晰的申请号字符,需要将申请号信息从整个票据复杂的背景中提取出来,消除噪声,以降低后续步骤难度。采用阈值分割,调节灰度值调用threshold算子,调节灰度值过后的图像突出了申请号字符信息,见图4。 2.2.2填充缝隙与滤波 灰度值调整后的数字图像仍存在许多噪声,去除这些噪声干扰,常采用数学形态学方法进行去噪[8]。数学形态学有4个基本运算:膨胀、腐蚀、开运算和闭运算。数学形态学利用结构元素作为探针不断移动图像信息来了解图像的结构特征。为使图像数字特征更为明显,调用fill_up_shape和dilation_circle算子填充字符内部的黑色部分;对深色部分进行处理时,调用形态学opening_circle算子以抑制杂波。为满足申请号字符精准检测提取要求,在图像预处理阶段需将灰度值调整、填充缝隙、滤波等3种处理方式相互协调使用。 2.3申请号定位与分割图像 申请号字符定位算法是整个字符识别的核心,从专利票据可以看到许多数字组合,但是申请号的位数是固定的,而且距离整个方框中心最近。基于此,可以根据申请号的长度定位申请号,但最下排汉字会存在干扰,如图5所示绿色部分。 通过申请号的方框两条竖线定位中心,寻找距离中心较近目标,即为申请号位置,见图5。HALCON主要程序如下:MiddleColumnSum:=0 for i := 1 to NumIntermediate2 by 1 MiddleColumnSum:=(Row22[i-1]+Row21[i-1])/2+MiddleColumnSum endfor MiddleColumn:= MiddleColumnSum/NumIntermediate2 **寻找与竖线中心坐标最接近的目标,即为申请号devbig:=0 dev:=0 for i := 1 to NumIntermediate3 by 1 dev :=(Row22[i-1]+Row21[i-1])/2 if(dev>devbig) devbig:=dev n:=i endif endfor 确定申请号位置后,单独分割提出申请号部分图像,见图6,再应用图像处理技术,对申请号字符串进行分割。首先进行图像分割,通过对原始图像进行某种方式的分割处理,提取图像的某些特征,最常用的方法是阈值分割[910]。经过处理后,申请号字符可能存在一些微小的断裂,此时调用closing_circle算子以连接这些微小断裂,减少误识别。因为申请号字符水平排列成一排,可以调用closing_rectanglel算子将申请号字符在水平方向合并成一个整目标,调用connection算子把合并后的目标区域转换为一个个分离的对象,采用联合与分割方法分开字符,调用intersection算子和connection算子得到分割好的數字图像。经过以上步骤,整个申请号字符基本上能够清晰地显示出来,再使用sort_region算子将数字排列,调用region_to_bin算子把区域转化成二值图像,最后将图像显示出来,结果如图7所示。 2.4OCR匹配 在HALCON软件中进行OCR图像处理和识别:根据申请号字符特征,将经过处理后的图像与已知 “模板”进行比对,把置信度最高的值返回到class中,进行自动识别然后输出结果。字符检测提取 “模板”非常重要,它将决定最后匹配结果的精准度。申请号一般是非常简单的数字和字母组合,所以本系统采用HALCON自带的OCR模板库即可。但是如果想识别其它文字等符号,则需要使用函数库,或者创建及训练ORC分类器,即建立相应的“模板”。 2.5识别字符 采用模板匹配法识别字符。将待识别的字符逐个与建立好的模板字符匹配。识别过程就是利用模板,对要识别的对象进行图形处理,最后通过OCR模板匹配度算子得到结果。 首先调用read_ocr_class_mlp算子读取分类文件,读取 HALCON 自带的 'Industrial_0-9A-Z.omc' 模板文件。do_ocr_multi_class_mlp算子将最终处理后得到的图像与模板逐一匹配,得到匹配结果和匹配置信度,再调用smallest_rectangle1算子提取特征,得到该图像上的字符方位,为后面定位操作提供参考。最后选择一个起始位置显示识别结果,这里要用到set_tposition 和write_string 两个算子。程序运行结果见图8。 3结语 票据特殊字符人工提取不仅工作量大、速度慢,而且枯燥乏味,容易因疏忽导致错误。本文将机器视觉技术应用到专利票据申请号提取中,能准确识别出专利发票收据上的申请号,实现了自动快速检测提取,大幅降低了成本,提高了效率和准确度。此技术还可识别增值税发票等不同种类票据,在财务管理等领域用途广泛。 参考文献:[1]赵杰文,陈振涛,邹小波.机器视觉实现方便面破损在线检测的研究[J].微计算机信息,2007,23(10):238240. [2]孙怀远,廖跃华,周夫之,等.基于HALCON的药品包装瓶批号检测技术研究[J].包装工程,2008,29(8):7173.[3]彭晓辉.基于HALCON的IC卡喷码符号识别技术研究与实现[D].广州:广东工业大学,2006. [4]肖海俊,葛广英,姚坤,等.基于HALCON的喷码字符识别技术的研究与实现[J].现代电子技术,2015,38(15):9598. [5]郭佳寅,岳秀江,吴双,等.基于HALCON的乳制品箱体喷码字符识别方法研究[J].制造业自动化,2013(3):2122. [6]杨莉,潘丰.基于机器视觉的硬盘磁体检测系统设计[J].江南大学学报:自然科学版,2012,11(5):505-508.[7]孙怀远,杨丽英,周夫之.基于机器视觉技术的药品瓶包装在线检测系统[J].自动化与控制,2011(2):4650.[8]春霞,魏敏,唐正宁.基于数学形态学的印刷网点图像分割方法[J].包装工程,2007,28(6):14-15,36. [9]李程鹏,范彦斌,胡青春.基于HALCON的PCB光学定位点的3种识别方法及比较[J].佛山科技学院:自然科学版,2010,28(2):2933. [10]郑南宁.计算机视觉与模式识别[M].北京:国防工业出版社,1998.(责任编辑:杜能钢) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。