标题 | 基于多分类器集成的图像文字识别技术及其应用研究 |
范文 | 罗笑玲 黄绍锋 欧阳天优 凌一宏 潘家辉 摘要:本文本主要对图片文字提取展开研究,首先读取图片进行预处理;然后针对网格特征和方向特征对图片文字进行特征提取;为了提高识别系统的可靠性,采用多分类器集成方法,即通过多个互补的分类器来改善单个分类器的性能。 关键词:图像文字识别;特征提取;多分类器集成;印刷体汉字 中图分类号:TP311 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.03.019 本文著录格式:罗笑玲,黄绍锋,欧阳天优,等,基于多分类器集成的图像文字识别技术及其应用研究[J].软件,2015,36(3):98-102 0.引言 社会发展进入信息时代,随着实践活动的扩大、深入和社会化需要,人类需要去识别很多类的形式内容复杂的信息。人们已经不再停留在自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机。由于科技水平不断提高,使得各种不同的研究对象得到“图像化”和“数字化”,以图像为主的多媒体信息迅速成为重要的信息传递媒介,图像中的文字信息包含了丰富的高层语义信息。提取出这些文字,对于图像高层次语义的理解、索引和检索非常有帮助。 现在对于文字图像识别技术的研究,还面临几个问题,一是图像数据量大,一般来说,要取得较高的识别精度,原始图像应具有较高的分辨率,至少应大于64×64。二是图像污损,由于目标环境的干扰、传输的误差、传感器的误差、噪声、背景干扰、变形等会污损图像。三是准确性,位移、旋转、尺度变化、扭曲,和人类的视觉一样,目标和传感器之间存在有位置的变化,因此,要求系统在目标产生位移、旋转、尺度变化、扭曲时,仍能够正确识别目标。四是实时性,在军事领域的应用中,大都要求系统能够实时的识别目标,这就要求系统有极快的出来速度和识别效率。 鉴于当前文字识别系统的发展现状,如何提高印刷体文字的识别率仍是当前的研究热点,如何在世界场景下识别文字将是文字识别系统发展的一个方向。此外,如何构建具有版面自动分析、容错性强、识别率高、错误自学习自修正、易扩展特点的文字识别系统是文字识别自动化的研究目标。所以,图像文字识别技术的研究显得尤为重要。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。