一种改进的维吾尔文字图像分割算法研究

伊力哈木·亚尔买买提



摘 要: 针对复杂背景下维吾尔文字图像分割时产生缺陷和干扰问题,提出一种自适应二值势函数目标模糊C均值算法。首先,使用自适应势目标二值函数聚类方法来获取集群的维吾尔文字二值图像分割和聚类中心,然后利用其隶属度矩阵的最佳数量确定模糊计算维吾尔文字图像分割模糊聚类的维吾尔文字图像。实验结果表明,该算法可以实现维吾尔文字图像的自适应分割,准确地分割出维吾尔文字区域部分,同时极大地减少了计算复杂性,有利于实现维吾尔文字图像处理的准确度。
关键词: 维吾尔文字; 势函数; 隶属度矩阵; 像素分割理论
中图分类号: TN911.73?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)04?0120?04
Research on an improved image segmentation algorithm for Uyghur characters
YILIHAMU Yaermaimaiti
(College of Electrical Engineering, Xinjiang University, Urumqi 830047, China)
Abstract: Since the Uyghur characters segmented under the complicated background may cause the defect and interference, a binary potential function target segmentation algorithm of the adaptive fuzzy C?means is proposed. The adaptive potential target binary function clustering method is used to segment the Uyghur characters binary image of the clustering and obtain the clustering center. The optimal quantity of the membership matrix is employed to determine the Uyghur characters image by means of the pixel segmentation theory, which obtained from the Uyghur characters′ image segmentation fuzzy clustering with fuzzy calculation. The experimental results show this algorithm can segment the Uyghur characters image adaptively and Uyghur characters area accurately, reduce the computational complexity greatly, and is conducive to the improvement of the image processing accuracy of the Uyghur characters.
Keywords: Uyghur character; potential function; membership matrix; pixel segmentation theory
0 引 言
对维吾尔文字符图像分割识别的研究,不仅可以增强对新疆少数民族信息处理技术的提高和中国多文种信息处理及办公自动化具有很大的促进作用,而且对使用阿拉伯文字的国家和民族也具有较强的适应性和通用性[1]。
现在维吾尔文字图像目标分割技术具有不同类型的分割方法,比较有突出代表性的有边缘目标检测法,阈值目标分割法,特定区域目标生长方法和特征目标二值聚类算法等[2]。
边缘检测法主要是基于图像像素的边界点的主要边缘检测算子突变的灰色值,如果图像检测数据的边缘呈现不连续性,则主要分为两种类型的串行和并行算法,其缺点是图像的形象尚不清楚,或包含更多的边缘差分割。基于图像区域方法其特性值为类似图像的同一区域,区域或类似像素和像素区域是基于区域的方法,单独和不同切片区域最终形成很大的差异,缺点是其进程序列的性质,有选择的种子和像素或区域过程, 很强依赖性及高复杂性和测试序列对象在灰度图像阈值分割方法,应用最广泛。灰度图像直方图有多个峰值,每一个峰对应于区域,此算法的缺点是该算法考虑到只是灰色的级别的信息,无视图像的空间信息,并且呈现不连续性。
鉴于此,提出一种新的基于维吾尔文字图像的自适应模糊C均值的二值势函数目标分割算法。首先确定潜在二值函数聚类算法第一图像自适应的最优簇数目,然后确定聚类函数中心和最后分割的维吾尔文字图像模糊二值聚类方法。实验结果表明该算法可以实现维吾尔文字图像的自适应分割。
1 势函数聚类方法
1.1 基于圖像分割的二值势函数聚类算法
定义1:设代表一类数字图像,,代表准备图像分割的具体大小是,代表准备分割的图像在像素为单位点的灰度平均值。确定准备分割的图像的质量分布图机会率密度函数为[3]:
(1)
式中,
(2) 灰度平均值为的像素单位点在准备分割的图像中表现的机会率由近似局部表示。在准备分割的图像中,不同的图像目标区域和图像背景区域,要准备分割的图像像素单位点的灰度值不均匀地分布在所有灰度图像,但主要集中在几个不同灰度范围,这表明一定灰度范围内出现图像单位像素点的灰度值机会率相对较大,这就是图像质量分布图机会率函数曲线表现出的特征峰的原因。
定义2:设代表准备分割的图像的质量分布图机会率函数,并设定将准备分割的图像的归一化质量分布图机会率函数为:
(3) 式中,,通过归一化质量分布图函数的定义,质量分布图机会率函数变换范围为区间。
定义3:将分割的维吾尔文字图像的质量分布图二值势函数表示为:
(4)
准备分割的图像的质量分布图势函数本质是对势函数的基准点的插值,其基础函数一般采用的模式。作为一个平滑二值函数,其二值自变量的涨势呈现平方二值化倒数的比值递减,因此,质量分布图势函数较二值归一化机会率函数要光滑很多。使用适当的非变量控制二值因子,则质量分布图势函数与归一化二值质量分布图机会率函数的特征峰谷特性十分相似[4]。
定义4:定义准备分割的维吾尔文字图像的归一化二值函数质量分布图势函数为:
(5)
其归一化的二值函数质量分布图势函数的定义即将函数质量分布图二值势函数变换为区间。
定义5:设为准备分割的有效维吾尔文字图像的当前归一化的二值质量分布图势函数,其准备分割的维吾尔文字图像的二值函数质量分布图阶剩余的有效二值势函数为:
(6)
式中:
(7)
为半径衰减控制函数因素;为二值函数质量分布图中其特征波峰的基数值。
定义模糊衰减因子:
(8)
式中:为实验基本常数;代表准备分割的图像灰度级的深度,其代表值为准备分割的图像中最大和最小像素灰度规模的区别[5]。
定义6:基于质量分布图二值函数的剩余潜力定义为潜在分区二值函数组数为:
(9)
式(9)表示潜在的分区函数组就是其中心点在并其高度为的四次二值基函数。在潜在的分区函数组中,如果各个特征波峰在质量分布图潜在的分区函数中分布均匀,则两个峰值之间的最佳距离应为。
定义7:自适应模糊二值赝势因子。
系数如下:
(10)
式中,为一实验常数。
设和为潜在的分区函数组中两个横向相邻的峰值点的潜在功能分区坐标,其结果值由式(7)计算得到,若:
(11)
则其中一个潜在的分区函数为伪势,此时将这两个潜在的分区函数合并。合并伪势的具体做法为:分别提取质量分布图潜在的分区函数组中存在伪势的两个质量分布图潜在的分区函数的极值,比较这两个稳定值获得其一的最大值,接下来将这两个潜在的分区函数二值曲线叠加,并且来合并其和二值势函数如式(12)所示,然后进一步得到质量分布图潜在合并伪势后的分区函数:
(12) 式中:表示潜在的分区二值函数存在伪势的两个质量分布图的最大值;代表和函数的稳定二值基数点。
1.2 最大势剩余高度的自适应确定
势能二值函数聚类的算法中其阈值必须在其循环迭代中停止,在算法中该阈值二值函数被称为剩余高度的最大势,而且其结果基数值的变化范围为。需要达到以下两个原则[6]:
(1) 针对不同灰阶的图像特性,的设定需要留存图像的“势”的信息特征;
(2) 的设定要降低算法的运算复杂性,以免造成不必要的重复运算。
找出二值函数最大势的剩余高度与分散之间的灰度级函数图像的关系,得到归一化二值函数自适应的最大势方法来确定其剩余高度。
2 基于自适应模糊C均值的二值势函数的维
吾尔文字图像分割算法
算法的具体步骤如下:
(1) 其聚类中心和集群的准备分割维吾尔文字图像的最佳数目由有效聚类算法的二值势函数来确定:
① 由式(1)、式(4)、式(5)计算准备分割的维吾尔文字图像的质量分布图机会率二值函数,二值势函数,有效归一化质量分布图二值势函数,其中为有效灰度级范围数。
② 由步骤①计算可得归一化质量分布图二值势函数的所有峰值为,其中为归一化质量分布图二值势函数的波峰的数量;
③ 令初始分类数;
④ 由式(8)计算模糊递减系数,由式(10)计算模糊二值伪势因子;
⑤ 令各个二值伪势数,由式(6)计算剩余二值势函数,其隶属于准备分割的维吾尔文字图像质量分布图阶[7],以及二值势稳定值点,;对应于所有,若其中出现伪势,则定义;
⑥ 计算的峰值,如果,则到步骤⑦,否则,到步骤④;
⑦ 由式(9)计算准备分割的图像质量分布图二值函数组;
⑧ 将按照由升序的顺序排序,并按照的排序规则对潜在的分区二值函数组进行排序,并得到其排序结论为;
⑨ 是否存在真正的伪势一般由潜在两峰值间距的分区二值函数组来断定,如果存在,那么就由式(12)对两个潜在的分区二值函数来进行有效合并,在得到真正的有效合并伪势后的潜在的分区二值函数。经过真正的伪势有效合并后,所求得的聚类中心为其潜在的分区二值函数组中势稳定值点,而且势稳定二值函数值點数目即为准备分割的维吾尔文字图像[8]的最佳二值聚类数目。
(2) 模糊聚类:
① 计算出准备分割的欧氏距离,即维吾尔文字图像中每个基本二值像素单位点与二值聚类中心的距离,其式如下:
(13)
② 由及计算出准备分割的维吾尔文字图像中所有像素有效单位点以及从属于聚类中心的从属度,如下:
(14)
③ 像素单位点的分类,将准备分割的图像中每个像素单位点的从属度,来做详细比较,把像素单位点归纳并属于最大的一类,经二值聚类[9]得到最终的分割的图像。
维吾尔文字图像分割算法流程如图1所示。
3 实验结果与分析
在实验中设置聚类数目相同的情况下,比较其两种算法的分割有效结果及其效率。在实验中,选取两组维吾尔文字图像有效数据进行仿真实验,这两组维吾尔文字图像都是属于复杂背景之下。
实验参数的选取:恒定控制因子,参数,,传统分割算法中循环迭代次数次,阈值数,模糊加权指数。如图2及图3所示。
两种算法运算时间对比如表1所示。
由仿真实验分割图结果可以看出,本文所提出的分割算法在实验效果图上能够与传统的模糊均值方法效果相同或分割结果更好,并从表1对比结果可以得到,本文所提出的算法在分割速率上好于传统的模糊均值算法。本文算法能够自适应获得每幅图像的最大二值函数势的剩余高度,并由来控制维吾尔文字图像的自适应二值聚类,从而达到一种完全实现自动的无监督的图像分割方法,不仅确保了分割的准确度,提高了分割速率,而且该算法是一种有效的分割算法。
4 结 论
本文首先详细介绍了二值势函数集群理论,并根据图像像素单位点的灰度级分布特征,针对传统的模糊C均值算法必须预先设置二值聚类有效个数、高度的计算缺陷的操作复杂性,将有效合理的二值势函数的集群验证理论深入到分割算法中,提出一种基于二值势函数有效集群的自适应二值函数模糊C均值维吾尔文字图像分割算法,该算法确定最优群集数和直接通过群集聚类的方法获取集群的维吾尔文字图像分割和聚类中心,然后使用图像像素的模糊隶属度矩阵计算理论,及模糊聚类有效合理的分割最终获取维吾尔文字图像。实验结果表明,该算法能够实现维吾尔文字图像的自适应分割,确保其分割的准确度,同时大大降低了算法的计算复杂度,它有利于对维吾尔文字图像准确性分割处理。
参考文献
[1] MAYER A, GREENSPAN H. An adaptive mean?shift framework for MRI brain segmentation [J]. IEEE transactions on medical image, 2009, 28(8): 1238?1250.
[2] BAZI Y, BRUZZONE L, MELGANI F. Image thresholding based on the EM algorithm and the generalized Gaussian distribution [J]. Pattern recognition, 2007, 40(2): 619?634.
[3] 王秀和.利用K均值算法改进后的蚁群优化算法对高光谱图像聚类研究[J].科技通报,2015,31(3):202?206.
[4] 刘刚,梁晓庚,张京国.基于轮廓波变换和改进模糊C均值聚类的红外图像分割[J].系统工程与电子技术,2011,33(2):443?448.
[5] 王坤,张恺,王力,等.结合博弈论的马尔可夫随机场红外图像分割[J].红外技术,2014(10):801?806.
[6] 安剑奇,吴敏,何勇,等.基于信息融合的高炉料面红外图像分割方法[J].中南大学学报(自然科学版),2011,42(2):391?397.
[7] 哈力旦·A,库尔班·买提木沙.基于小波变换的图像中维吾尔文字定位[J].计算机工程,2011(8):197?198.
[8] 邵海燕,张振海,李科杰,等.复杂野外环境下水障碍识别技术综述[J].计算机测量与控制,2014(1):1?4.
[9] 杨如林,丑修建,李庆,等.一种快速鲁棒的红外图像分割方法[J].电视技术,2015,39(3):11?15.
[10] 魏英姿,李静静.红外图像分割的改进模糊C均值聚类方法[J].计算机工程与应用,2014(9):163?166.