标题 | 图像阈值分割在教学中的研究与应用 |
范文 | 李新利 李笑笑 杨国田
摘 ? 要:图像处理是人工智能的基础,而图像分割是图像处理的关键技术。图像特征提取和目标识别,在一定程度上取决于图像分割的质量如何。在图像处理与分析课程教学过程中,文章针对阈值分割算法和效果进行研究,提出了一种基于和声搜索的阈值寻优算法;基于图形用户界面,编写了图像阈值分割算法软件。软件可实现基本全局阈值、Otsu最佳全局阈值、多个全局阈值、局部均值阈值、局部中值阈值、自适应分块阈值以及基于和声搜索的阈值分割算法。学生可直观感受不同阈值分割算法的分割效果和特点,图像阈值分割软件具有良好的教学效果和启发学生创新思维的作用。 关键词:图像处理;阈值分割;和声搜索;图形用户界面 中图分类号:TP317.4 文献标志码:A 文章编号:1673-8454(2020)13-0093-04 一、引言 图像处理、分析和识别是进行人工智能深入研究的基础。随着人们对人工智能科学的进一步重视,图像处理问题作为一项研究热点进入越来越多人的视野。图像处理与分析课程是模式识别与智能系统学科核心专业学位课,其内容融合了计算机图形学、计算机视觉和模式识别等多个领域的知识,需要学生具有较强的理论综合能力和实践能力。因此培养理论与实践并重的高素质人才成为教学的重要任务。 图像分割是图像识别和计算机视觉至关重要的预处理。没有正确的分割就不可能有正确的识别。但是,在进行具体的分割时经常会遇到各种问题。例如光照不均、噪声过多、背景与目标差别过大等,造成分割效果不理想。而不同的图像分割算法也各具特点。因此在教学中,为了让学生能够对比理解多种图像分割算法的特点,本文基于图形用户界面,设计图像阈值分割算法软件,并提出一种基于和声搜索的阈值分割算法,不仅能让学生直观感受不同图像阈值分割算法的特点与效果,还启发学生对科研创新的灵感。 二、图像阈值分割算法 1.图像阈值分割原理[1] 假设图像中的灰度直方图对应于图像f(x,y),该图像由暗色背景上的较亮物体组成,以这样的组成方式,物体像素和背景像素所具有的灰度值组成了两种支配模式。阈值分割即通过选择阈值T,将不同模式分开,从背景中提取物体。此时,f(x,y)>T的任何点(x,y)为一个对象点;否则为背景点。分割后的图像g(x,y)如(1)所示。 g(x,y)=1, ? f(x,y)>T ? 0, ? f(x,y)≤T(1) 式(1)中,当适用于整个图像时为全局阈值处理。当T值发生改变时,图像中任何点(x,y)的T值取决于(x,y)的邻域特性(例如邻域中像素的平均灰度),此时为可变阈值。 2.全局阈值 全局阈值的分割与点的灰度值有关。整幅图像使用同一个阈值做分割处理,适用于背景和前景有明显对比的图像。 (1)基本全局阈值 在目标和背景差异明显、灰度值相差较大的时候,采用基本全局阈值比较好。如图1所示,原始图像取自伯克利数据库。[2]分割阈值选择直方图中两个波峰间的波谷所对应的灰度值,实现对场景中月亮的分割。 (2)Otsu最佳阈值 Otsu算法采取最大类间方差作为判断标准,不需要输入附加参数。不论图像的直方图是否有明显的双峰,均可以找到较理想的阈值,获取较好的分割效果。图2为生物质燃料燃烧实验中的火焰图像,其直方图没有明显的双峰。采用Otsu最佳阈值分割,其分割效果如图2c所示。分割有助于提取火焰面积、形状等特征信息,进一步进行燃烧状况、燃料燃烧性能等的深入研究。 (3)多阈值 多阈值是对单个阈值的扩展。当图像直方图有多个波峰波谷的时候,可以采用多阈值处理把图像分割成多个区域。图3原始图像取自伯克利数据库[2],采用多阈值分割效果如图3所示。 3.可变阈值 (1)分块阈值 可变阈值分割与图像像素的空间坐标有关。当照明不均匀、有突发噪声或者背景灰度变化较大时,分块阈值分割能得到较好的分割效果。将原始图像划分成较小的子图像,并对每个子图像选取相应的阈值。图4为某燃煤机组炉膛燃烧层的燃烧火焰图像,煤粉和一次风混合气流从左侧进入炉膛,在火焰图像中形成一段类似舌形黑龙的区域,即未燃烧区。通过图像分割可提取未燃烧区信息,对进一步研究炉内燃烧状况具有重要作用。 (2)局部阈值 局部阈值分割可以根据图像的局部特征进行处理,其与图像像素位置、灰度值及邻域特征值有关。图5为墙体裂缝图像,由于光源位置和拍摄角度产生光照不均问题,采用局部阈值分割可以得到比较好的效果。 三、基于和声搜索的阈值分割算法 1.和声搜索算法思想 和声搜索(Harmony Search,HS)算法是一种新颖的智能优化算法,模拟了音乐演奏的原理。基本和声搜索算法思想如下:[3] Step1:在可选音调范围[xmin,xmax]内随机产生与和声记忆库大小(Harmony Memory Size,HMS)数目相同的HMS组音调X1、X2……XHMS。其中每组音调包含n個音,以X1为例:X1=[X11,X12,…,X1n],x11,x12,…,x1n皆属于[xmin,xmax]范围。 Step2:将每组音调按照某种组合方式生成HMS个和声f(X1)、f(X2)……f(XHMS)。将每组音调与对应的和声一起放入和声记忆库(Harmony Memory,HM),得到初始化和声记忆库,其形式如(2)所示: Step3:在[0,1]之间随机产生一个变量r1,将r1与记忆库取值概率(Harmony Memory Considering Rate,HMCR)相比较。如果r1小于HMCR,则在初始化的和声记忆库中随机选取一组和声。否则,在可选音调范围[xmin,xmax]随机产生一组音调,按照Step2中的组合方式生成得到一组和声。 Step4:如果这组和声是从和声记忆库中得到的,需要对这组和声进行微调。在[0,1]之间随机产生变量r2,如果r2小于音调微调概率(Pitch Adjusting Rate,PAR),则随机让音调向上或向下调整微调带宽 (band width,bw)大小,得到一组新和声。否则,不做调整。 Step5:若新和声优于和声记忆库中最差和声,则用新和声替换最差和声,得到新的和声记忆库。否则,和声记忆库不做改变。不断重复Step3、Step4,直到创作(迭代)次数达到设定值。此时和声记忆库中的最优和声即为所求。 2.基于和声搜索的图像阈值分割 基于和声搜索的图像阈值分割算法,本质是进行阈值寻优。通过选取图像类间灰度均值差作为和声搜索算法的目标函数,能使类间灰度均值差最大的阈值即为分割阈值。其分割流程如图6所示。 针对电缆隧道的隧道墙体裂纹检测,隧道的特殊环境会使摄像机拍摄墙体图片时,出现光照不足和对比度不高情况。对此墙体图像进行图像处理检测裂缝,采用本文所提出的基于类间灰度均值差的和声搜索算法进行分割,并与其他阈值分割算法进行对比,如图7所示。基于类间灰度均值差的和声搜索算法可以取得较为满意的结果。 四、基于图形用户界面的图像阈值分割 图形用户界面主要由窗口、菜单、对话框等各种图形对象组成,便于人机交互。[4]本文基于图形用户界面编程实现包括图像全局阈值分割、可变阈值分割以及基于和声搜索的阈值分割在内的7种图像分割算法。 1.图像阈值分割界面设计 为便于实验演示和学生操作,设计软件通过选择图像按钮获取图像并得到图像直方图分别显示在两个axes部件,通过点击不同的图像阈值分割算法可以对图像进行处理并在第三个axes部件上输出图像。可编辑界面如图8所示。 软件中包含七种分割算法可供选择,通过不同的算法可以得到不同的分割效果。用户界面可对分割算法参数进行调整,包括改变多阈值分割阈值数量、改变局部阈值分割中滤波窗口的大小、改变自适应阈值分割的分块数目。学生可以在实际操作中了解各种分割算法及参数对分割效果的影响,从而在今后图像分割算法的选择上得到启发。 2.图形用户界面运行 图形用户界面运行窗口如图9所示。通过点击选择图像可获取原始图像及原始图像直方图,点击所选算法,可直观显示图像分割效果。再次选择其他算法,可以获得不同算法对同一图像的处理结果,通过保存图像按钮可以保存原始图像、原始图像直方图及处理后的图片,便于学生之后进行更细致的对比和分析。 五、教学应用及效果 图像处理与分析课程具有较强的理论性和实践性,为提升学生的综合素质和创新能力,针对图像阈值分割的教学,基于教学内容和教学方法进行研究和改进。 一是融入学科前沿和电力特色的教学内容。针对图像阈值分割,除了讲授经典分割方法,如全局阈值、Otsu最佳阈值、多阈值、分块阈值和局部阈值等,还给学生引入了基于和声搜索的阈值分割,及时让学生了解和关注到前沿知识和技术。针对图像阈值分割案例,紧密结合电力大学的学科特色,所选用的图像阈值分割案例包括电厂锅炉燃烧火焰图像、电缆隧道的墙体裂纹图像,以及生物质燃烧火焰图像等,把工程实际和科研项目中的相关图像处理内容融入教学过程中,实现专业知识和研究领域紧密结合。 二是理论和实践并重的教学方法。首先通过理论讲解,让学生初步学习不同图像阈值分割的算法原理,然后通过所设计的图像阈值分割软件,演示不同阈值分割算法的分割效果,以及分割算法中参数改变对分割效果的影响,让学生直观体会不同分割算法、不同参数的分割效果和特点,有助于学生理解不同分割算法的适用范围。理论和实践并重的教学方法,加深了学生对算法的理解,激发了学生的学习兴趣。 六、结语 在图像处理与分析课程教学过程中,本文针对阈值分割算法和效果进行研究,提出了一种基于和声搜索的阈值寻优算法。基于图形用户界面,设计实现包括基本全局阈值、Otsu最佳全局阈值、多个全局阈值、局部均值阈值、局部中值阈值、自适应分块阈值以及基于和声搜索的阈值分割算法。在教学中,实现了将学科前沿和电力特色内容融入基础知识的教学内容改进,以及理论与实践并重的教学模式。所设计的教学图像阈值分割软件不仅方便学生使用,而且培养了学生创新思维和科研能力。 参考文献: [1](美)Rafael C.Gonzalez,Richard E.Woods;阮秋琦,阮宇智等译.数字图像处理(第三版)[M].北京:电子工业出版社,2011.6:443-513. [2]Arbelaez P,Maire M,Fowlkes C,et al.Contour Detection and Hierarchical Image Segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(5): 898-916. [3]趙玉新,杨新社,刘利强.新兴元启发式优化方法[M].北京:科学出版社,2013.8:201-219. [4]宗节保,段柳云,王莹等.基于MATLAB GUI软件制作方法的研究与实现[J].电子设计工程,2010,18(7):54-56. (编辑:王天鹏) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。