网站首页  词典首页

请输入您要查询的论文:

 

标题 基于MATLAB英文语句识别技术的应用实践
范文

    郑新哲

    【摘 要】论文采用MATLAB提供的图像处理函数,对特定字体的英文语句图像进行了字符识别的尝试,实现了对英文字母、标点符号以及阿拉伯数字的识别。在代码调试过程中,解决了小字体识别及容易混淆的标点符号识别的难点。尽管采用的识别算法简单,同样得到了较为满意的结果。

    【Abstract】 In this paper, the image processing function provided by MATLAB is used to recognize the characters of English sentence images with specific fonts. It realizes the recognition of English letters, punctuation symbols and Arabic numerals. In the process of code debugging, the difficulties of small font recognition and confusing punctuation mark recognition are solved. Although the recognition algorithm is simple, it still obtains satisfactory results.

    【關键词】图像处理;英文字母识别;标点符号识别

    【Keywords】image processing; English letter recognition; punctuation recognition

    【中图分类号】TP391? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文献标志码】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章编号】1673-1069(2019)01-0144-02

    1 引言

    近年来,各种智能识别技术得到迅速发展,包括指纹识别、手写输入、车辆牌照识别、人脸识别等技术已经得到广泛应用。本文利用MATLAB提供的几个图像处理函数,研究了印刷体英文字母的识别方法和过程,对智能识别技术进行了初步尝试,对于在研究过程中遇到的标点符号及阿拉伯数字识别的误判问题,进行了原因分析与程序处理,最终得到满意的结果。本文对初次接触数字图像处理技术的人员具有引导和示范作用,可以作为学习数字图像处理课程的入门训练。

    2 基本算法及原理

    MATLAB 是 Matrix Laboratory (矩阵实验室)的缩写,是 Math Works 公司开发的一种功能强、效率高、简单易学的数学软件。MATLAB 的图像处理工具箱功能也十分强大,支持的图像文件格式丰富,如 *.BMP、*.JPG、 *.JPEG、 *.GIF、 *.TIF、*.TIFF、 *.PNG、*.PCX、*.XWD、*.HDF、*.ICO、*.CUR等。MATLAB提供了20 多类的图像处理函数,几乎涵盖了图像处理的所有技术方法,这些函数按其功能可分为:图像显示、 图像文件 I/O、图像算术运算、几何变换、图像登记、像素值与统计 图像分析、图像增强、线性滤波、线性二元滤波设计、图像去模糊、图像变换、邻域与块处理、灰度与二值图像的形态学运算、基于边缘的处理、色彩映射表操作、色彩空间变换、图像类型与类型转换等。

    基于MATLAB的图字符识别过程大体分成五个步骤:①建立字符样本库;②获取含字符的图像并对字符区域块进行定位和读取;③对各个字符进行切割提取;④所提取的图像字符与样本库中的样本进行比对,确定识别的字符;⑤输出识别的字符串。

    上述识别过程所涉及的核心算法包括:①彩色图像灰度化rgb2gray()、二值化im2bw();②根据需要对图像进行大小调整imresize();③根据垂直直方图分割字符,并根据零的宽度识别单词间隔;④建立字符模板数据库;⑤用适当算法进行识别和字符输出[1]。

    3 字符识别的实现

    3.1 准备工作

    ①选择测试的特定字体,本文采用宋体对应的英文字母;②准备包含该字体的英文语句的图像文件,这里用“.jpg”格式的文件进行测试;③准备该字体大小写英文字母及标点符号模板,每个字符用一个文件,采用二值化的“.bmp”格式。

    3.2 识别过程

    ①读入待识别图像文件。②先对图像进行灰度化处理,再对其进行二值化处理,必要时黑白反转。③根据像素值确定文字区域的位置,并截取该区域保存,待进行后续处理。④判断该区域的高度,若小于某值,则对此图像区域进行放大,以提高识别率。⑤根据图像中列像素的不连续性及其大小,分割字符并判断单词分割。⑥对分割出来的每个字符图像单独保存到变量中,并对其修整,去掉外围无效区域。⑦对已分割的字符图块,按高度分成高、低字符两类。⑧最关键的一步是字符识别,识别过程即为图像最佳匹配过程。有很多算法可以实现图像匹配评估,常用的有:直方图法、图像模板匹配法、SSIM(结构相似性度量)法、余弦相似度法、互信息度量法等。本文解决的内容相对简单,对于二值图像来讲可选用简单的算法即可。本文采用图像模板匹配法,将待识别字符图块和模板字符图块放大/缩小成同样大小的图像,用异或运算后的残余像素总数的多少判定匹配程度。⑨根据英文字母的特点,大写字符都属于高字符,而小写字符中的b,d,f,g,h,i,j,k,l,p,q,t,y为高字符,其余为低字符。待识别字符图块属于高字符类时,只与模板中的高字符相匹配;待识别字符图块属于低字符类时,只与模板中的低字符相匹配。⑩根据第5步中单词分割位置,将完整的英文语句输出到屏幕上。不能识别的字符用“?”替代。

    4 结语

    采用MATLAB提供的图像处理函数,可以实现英文语句图像的字符识别,对标点符号及阿拉伯数字也可以得到满意结果。与此同时,本文中提供的方法也存在以下问题:

    ①只能处理相同字体、大小一致的英文文本,且只能处理一行;

    ②由于采用了灰度化、二值化方法,文字与背景反差小的图像无法正确识别。

    本文仅用了简单的图像匹配算法,可以采用更好的特征提取法、相关系数法、神经网络算法等技术,以适应不同字体,提高识别的适应性和准确性。此外,通过在软件中建立学习功能,并对分辨不清的情况提供不同选项,可以使系统能识别不同字体,并提高识别的正确性和实用性。

    【参考文献】

    【1】张学军.基于MATLAB图像处理的车牌号识别系统设计[J].信息通信,2018(07):36-38.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2024/12/22 18:02:38