基于模糊聚类算法的体育运动视频图像分析应用
王科飞
摘 要: 针对当前的体育运动视频图像分割方法存在图像分割结果粗糙以及空间畸变率高等缺陷,提出基于模糊聚类算法的体育运动视频图像分割方法。介绍了模糊聚类算法的基本理论,借助时域差分图像建立含有正态分布和灰度值的二阶模糊属性,赋予模糊属性隶属度函数,进而对时域差分图像进行模糊聚类,再通过边缘检测得到运动视频图像分割结果。实验结果证明,该方法的空间精度高、噪声迭代性能好、空间畸变率低,可精准分割复杂运动视频图像,得到高清画面。
关键词: 模糊聚类算法; 隶属度; 体育运动视频; 图像分割
中图分类号: TN911.73?34; TP391.41 文献标识码: A 文章编号: 1004?373X(2017)09?0039?04
Abstract: Since the current sports video image segmentation methods have the defects of rough image segmentation result and high space distortion rate, a sports video image segmentation method based on fuzzy clustering algorithm is proposed. The basic theory of fuzzy clustering algorithm is introduced. The two?order fuzzy attribute containing the normal distribution and gray value is established by virtue of the time?domain difference image to give the fuzzy attribute S?membership function, so as to perform the fuzzy clustering to the time?domain difference image. The sports video image segmentation result is obtained with edge detection. The experimental results show that the proposed method has high space accuracy, perfect noise iteration performance and low space distortion rate, and can segment the complex sports video image accurately to obtain the high?definition image.
Keywords: fuzzy clustering algorithm; membership degree; sports video; image segmentation
0 引 言
随着网络和多媒体技术的快速发展,大量的体育运动和全民健身资料以视频和图片的形式保存在各类健身指导系统中。为更好的促进大众健身,便于学习和查看,对体育运动视频也有了编辑、分割、整合的多种需求。视频压缩技术也渐渐成为热点研究课题。视频压缩技术通过视频编码对视频容量进行缩减,便于释放存储空间并减少转存、传输用时,传统视频编码标准有MPEG?2,H.263等。MPEG指Moving Picture Experts Group,代表动态图像专家组,其计算冗余度小,整体性能比较平稳[1],H.263的效率则更高。
另外,视频编码技术需要将目标物体图像分割出来,以保证目标物体的编码完整性。然而传统视频编码标准无法搜索视频内容,具有一定的图像分割难度。2000年推出的MPEG?4加入了视频内容语义搜索功能,可将图像背景与前景分割为不同语义对象,编码效率有所提高,但其在编码过程中无法快速消除噪声。时域分割、频域分割是最早提出的专门用于运动视频图像分割的方法,经多次实践验证,这两种方法均没能对目标物体姿态进行精准描绘,图像分割不清晰。
因此,该研究基于模糊聚类算法对目标物体运动姿态变化强烈的体育运动视频进行研究,将有助于更好地利用和分析体育视频图像。
1 模糊聚类算法
模糊聚类算法来自于模式聚类理论,是一种使用数学法则描述分割区间的算法,进行体育运动视频图像分割时,模糊聚类算法利用迭代操作进行目标物体像素点区域分割,将图像像素划分到不同隶属度区间,做出图像分割决策。当目标物体拥有个像素样本时,将像素样本组成一个未聚类集合,表示为代表像素样本。设表示图像分割种类数量,表示模糊聚类加权因子。图像分割区域在数值上等同于像素点到聚类中心间距平方和的模糊聚类加权累计,即:
式中:代表隶属度函数集合,是像素点到聚类中点的间距;代表未聚类像素样本所处的隶属度种类为第类。
用表示含有所有隶属度种类的集合,是内的一个像素点模糊集合,代表样本的隶属度数值[2]。从隶属度数值可以看出样本属于何种分割区域,当时,必定不属于模糊集合当时,一定属于隶属度数值对视频图像的分割操作是极其严谨的,一旦确定出正确的模糊集合以及合适的隶属度函数,分割结果误差就可以被消除。
2 模糊聚类算法的体育运动视频图像分割方法
体育运动视频中的目标物体运动姿态比较随机,图像变化趋势模糊,分割区域不易确定[3],所提体育运动视频图像分割方法可将图像中目标物体的运动姿态区域与无用像素区域分割成前景与背景,提取目标物体的运动情况。
模糊聚类算法在体育运动视频播放状态下提取图像序列,并同时开启边缘检测进程,根据图像序列进行目标物体运动预测和补偿,在间距较小的若干幅图像上建立相同背景,利用相邻图像帧数值大小不同的属性提取时域差分图像,设置目标物体运动过程中的模糊属性并写入相应的隶属度函数,之后对时域差分图像进行模糊聚类,通过边缘检测进程切割目标物体边缘轮廓,得到前景区域,消除前景区域得到背景区域。图像分割框图如图1所示。
2.1 模糊聚类算法分割问题讨论
对于模糊聚类算法中模糊属性的选取需要讨论以下两个问题:一是目标物体的何种属性能够精准描述运动姿态;二是运动姿态区域与无用像素区域中的模糊属性不能相同且必须存在明显差别。经过讨论,所提体育运动视频图像分割方法发现,当运动视频图像中的目标物体历经运动预测和补偿后,背景区域可以表示成间距较小且背景相同的图像背景差值,此时,如果原体育运动视频图像的背景拥有正态分布性质,那么分割后的图像也应该拥有正态分布性质,并且像素分布平均值等于0。
因为运动姿态区域中目标物体运动姿态是随机变化的,分割图像前景的像素分布情况无法直接确定,前景区域无法提取,所以需要对图像进行灰度测量。背景中的不同帧图像像素点灰度差值相差不大,而前景的不同幀图像像素点灰度差值必然大于背景[4],根据这个性质,选取模糊属性时可将灰度值作为一个重要属性。另外,单一模糊属性对分割效果的增益不大,可从背景的正态分布性质出发,将运动姿态区域与无用像素区域的图像分割过程当成一个在正态分布像素内描述非正态分布像素的过程。文献[9]使用一种四阶矩阵提取非正态分布像素,设时域差分图像为代表像素点,采用一个运动的空心矩形衡量图像时域矩阵,即:
一般而言,SA越小的分割方法,其空间精度越高。不同分割方法的SA计算结果见表1,可见,本文采用的模糊聚类算法在四种分割方法中拥有最小的SA值,能够有效填充体育运动视频空间缺口,防止图像分割区域中出现空置,可以精准分割环境与色彩度等因素比较复杂的图像,空间精度高。
3.2 噪声迭代性能
分割方法需要对分割图像进行噪声迭代才能够得到高清晰度图像,人们对分割方法噪声迭代性能的基本要求是快速自适应收敛,图2是体育视频内两段连续变化运动图像的噪声平均值曲线,图3,图4是不同分割方法的迭代次数与噪声平均值关系曲线。图2中,两段连续变化运动图像的最大噪声平均值分别为0.40 dB和0.23 dB,噪声的整体上升趋势比较平缓。在图3,图4中,经过分割方法的处理,图像噪声有所降低,本文所提出的基于模糊聚类算法的体育视频图像分割方法在相同的迭代次数下能够进行快速自适应收敛,迭代6次就能将图像噪声降至原来的50%,拥有很好的噪声迭代性能。
3.3 空间畸变率
图5,图6分别是两段连续变化的运动图像在不同分割方法的处理过程中空间畸变率变化情况。空间畸变率的定义式如下:
式中:代表视频第帧图像的空间畸变率;分别代表分割像素值和完整像素值。
由图5,图6可知,空间畸变率与图像帧数、分割效果有关,段1图像帧数大,所以空间畸变率要明显低于帧数少的段2图像。模糊聚类算法在两段图像中的空间畸变率都比较稳定且数值较低,表示模糊聚类算法能够消除体育运动视频图像背景中的无用像素点,使分割图像噪声降低,得到清晰的运动目标变化趋势。而其他三种分割方法的空间畸变率较高且变化趋势不稳定,不能对图像噪声点进行有效处理,背景构建不成功,得到的分割图像比较模糊。
4 结 语
本文研究提出的基于模糊聚类算法的体育视频图像分割方法可以提高体育运动图像的分析水平和效果,与MPEG?4、频域分割、时域分割等方法相比,该方法在空间精度、噪声迭代性能以及空间畸变率的实验评估中均处于领先地位。该体育运动视频图像分析方法的应用将有助于通过视频图像分析掌握运动技术规律和健身人群的动作技能特点,为体育教学、全民健身和竞技体育水平提高服务。
参考文献
[1] 孙立新,张栩之,邓先瑞,等.自适应果蝇算法优化模糊均值聚类算法图像分割[J].控制工程,2016,23(4):494?499.
[2] 王少华,狄岚,梁久祯.基于核与局部信息的多维度模糊聚类图像分割算法[J].计算机应用,2015,35(11):3227?3231.
[3] 张杰,范洪辉.一种改进的模糊聚类图像分割算法研究与仿真[J].计算机仿真,2015,32(4):380?383.
[4] 薛艳锋,刘继华,高永强,等.一种加权模糊C均值聚类算法及其在图像分割中的应用[J].计算机应用与软件,2016,33(7): 273?277.
[5] 郑金志,郑金敏,汪玉琳.基于优化初始聚类中心的改进WFCM图像分割算法[J].软件,2015,36(4):136?142.
[6] 陈放,杨艳.基于超像素和模糊聚类的医学超声图像分割算法[J].半导体光电,2016,37(1):146?150.
摘 要: 针对当前的体育运动视频图像分割方法存在图像分割结果粗糙以及空间畸变率高等缺陷,提出基于模糊聚类算法的体育运动视频图像分割方法。介绍了模糊聚类算法的基本理论,借助时域差分图像建立含有正态分布和灰度值的二阶模糊属性,赋予模糊属性隶属度函数,进而对时域差分图像进行模糊聚类,再通过边缘检测得到运动视频图像分割结果。实验结果证明,该方法的空间精度高、噪声迭代性能好、空间畸变率低,可精准分割复杂运动视频图像,得到高清画面。
关键词: 模糊聚类算法; 隶属度; 体育运动视频; 图像分割
中图分类号: TN911.73?34; TP391.41 文献标识码: A 文章编号: 1004?373X(2017)09?0039?04
Abstract: Since the current sports video image segmentation methods have the defects of rough image segmentation result and high space distortion rate, a sports video image segmentation method based on fuzzy clustering algorithm is proposed. The basic theory of fuzzy clustering algorithm is introduced. The two?order fuzzy attribute containing the normal distribution and gray value is established by virtue of the time?domain difference image to give the fuzzy attribute S?membership function, so as to perform the fuzzy clustering to the time?domain difference image. The sports video image segmentation result is obtained with edge detection. The experimental results show that the proposed method has high space accuracy, perfect noise iteration performance and low space distortion rate, and can segment the complex sports video image accurately to obtain the high?definition image.
Keywords: fuzzy clustering algorithm; membership degree; sports video; image segmentation
0 引 言
随着网络和多媒体技术的快速发展,大量的体育运动和全民健身资料以视频和图片的形式保存在各类健身指导系统中。为更好的促进大众健身,便于学习和查看,对体育运动视频也有了编辑、分割、整合的多种需求。视频压缩技术也渐渐成为热点研究课题。视频压缩技术通过视频编码对视频容量进行缩减,便于释放存储空间并减少转存、传输用时,传统视频编码标准有MPEG?2,H.263等。MPEG指Moving Picture Experts Group,代表动态图像专家组,其计算冗余度小,整体性能比较平稳[1],H.263的效率则更高。
另外,视频编码技术需要将目标物体图像分割出来,以保证目标物体的编码完整性。然而传统视频编码标准无法搜索视频内容,具有一定的图像分割难度。2000年推出的MPEG?4加入了视频内容语义搜索功能,可将图像背景与前景分割为不同语义对象,编码效率有所提高,但其在编码过程中无法快速消除噪声。时域分割、频域分割是最早提出的专门用于运动视频图像分割的方法,经多次实践验证,这两种方法均没能对目标物体姿态进行精准描绘,图像分割不清晰。
因此,该研究基于模糊聚类算法对目标物体运动姿态变化强烈的体育运动视频进行研究,将有助于更好地利用和分析体育视频图像。
1 模糊聚类算法
模糊聚类算法来自于模式聚类理论,是一种使用数学法则描述分割区间的算法,进行体育运动视频图像分割时,模糊聚类算法利用迭代操作进行目标物体像素点区域分割,将图像像素划分到不同隶属度区间,做出图像分割决策。当目标物体拥有个像素样本时,将像素样本组成一个未聚类集合,表示为代表像素样本。设表示图像分割种类数量,表示模糊聚类加权因子。图像分割区域在数值上等同于像素点到聚类中心间距平方和的模糊聚类加权累计,即:
式中:代表隶属度函数集合,是像素点到聚类中点的间距;代表未聚类像素样本所处的隶属度种类为第类。
用表示含有所有隶属度种类的集合,是内的一个像素点模糊集合,代表样本的隶属度数值[2]。从隶属度数值可以看出样本属于何种分割区域,当时,必定不属于模糊集合当时,一定属于隶属度数值对视频图像的分割操作是极其严谨的,一旦确定出正确的模糊集合以及合适的隶属度函数,分割结果误差就可以被消除。
2 模糊聚类算法的体育运动视频图像分割方法
体育运动视频中的目标物体运动姿态比较随机,图像变化趋势模糊,分割区域不易确定[3],所提体育运动视频图像分割方法可将图像中目标物体的运动姿态区域与无用像素区域分割成前景与背景,提取目标物体的运动情况。
模糊聚类算法在体育运动视频播放状态下提取图像序列,并同时开启边缘检测进程,根据图像序列进行目标物体运动预测和补偿,在间距较小的若干幅图像上建立相同背景,利用相邻图像帧数值大小不同的属性提取时域差分图像,设置目标物体运动过程中的模糊属性并写入相应的隶属度函数,之后对时域差分图像进行模糊聚类,通过边缘检测进程切割目标物体边缘轮廓,得到前景区域,消除前景区域得到背景区域。图像分割框图如图1所示。
2.1 模糊聚类算法分割问题讨论
对于模糊聚类算法中模糊属性的选取需要讨论以下两个问题:一是目标物体的何种属性能够精准描述运动姿态;二是运动姿态区域与无用像素区域中的模糊属性不能相同且必须存在明显差别。经过讨论,所提体育运动视频图像分割方法发现,当运动视频图像中的目标物体历经运动预测和补偿后,背景区域可以表示成间距较小且背景相同的图像背景差值,此时,如果原体育运动视频图像的背景拥有正态分布性质,那么分割后的图像也应该拥有正态分布性质,并且像素分布平均值等于0。
因为运动姿态区域中目标物体运动姿态是随机变化的,分割图像前景的像素分布情况无法直接确定,前景区域无法提取,所以需要对图像进行灰度测量。背景中的不同帧图像像素点灰度差值相差不大,而前景的不同幀图像像素点灰度差值必然大于背景[4],根据这个性质,选取模糊属性时可将灰度值作为一个重要属性。另外,单一模糊属性对分割效果的增益不大,可从背景的正态分布性质出发,将运动姿态区域与无用像素区域的图像分割过程当成一个在正态分布像素内描述非正态分布像素的过程。文献[9]使用一种四阶矩阵提取非正态分布像素,设时域差分图像为代表像素点,采用一个运动的空心矩形衡量图像时域矩阵,即:
一般而言,SA越小的分割方法,其空间精度越高。不同分割方法的SA计算结果见表1,可见,本文采用的模糊聚类算法在四种分割方法中拥有最小的SA值,能够有效填充体育运动视频空间缺口,防止图像分割区域中出现空置,可以精准分割环境与色彩度等因素比较复杂的图像,空间精度高。
3.2 噪声迭代性能
分割方法需要对分割图像进行噪声迭代才能够得到高清晰度图像,人们对分割方法噪声迭代性能的基本要求是快速自适应收敛,图2是体育视频内两段连续变化运动图像的噪声平均值曲线,图3,图4是不同分割方法的迭代次数与噪声平均值关系曲线。图2中,两段连续变化运动图像的最大噪声平均值分别为0.40 dB和0.23 dB,噪声的整体上升趋势比较平缓。在图3,图4中,经过分割方法的处理,图像噪声有所降低,本文所提出的基于模糊聚类算法的体育视频图像分割方法在相同的迭代次数下能够进行快速自适应收敛,迭代6次就能将图像噪声降至原来的50%,拥有很好的噪声迭代性能。
3.3 空间畸变率
图5,图6分别是两段连续变化的运动图像在不同分割方法的处理过程中空间畸变率变化情况。空间畸变率的定义式如下:
式中:代表视频第帧图像的空间畸变率;分别代表分割像素值和完整像素值。
由图5,图6可知,空间畸变率与图像帧数、分割效果有关,段1图像帧数大,所以空间畸变率要明显低于帧数少的段2图像。模糊聚类算法在两段图像中的空间畸变率都比较稳定且数值较低,表示模糊聚类算法能够消除体育运动视频图像背景中的无用像素点,使分割图像噪声降低,得到清晰的运动目标变化趋势。而其他三种分割方法的空间畸变率较高且变化趋势不稳定,不能对图像噪声点进行有效处理,背景构建不成功,得到的分割图像比较模糊。
4 结 语
本文研究提出的基于模糊聚类算法的体育视频图像分割方法可以提高体育运动图像的分析水平和效果,与MPEG?4、频域分割、时域分割等方法相比,该方法在空间精度、噪声迭代性能以及空间畸变率的实验评估中均处于领先地位。该体育运动视频图像分析方法的应用将有助于通过视频图像分析掌握运动技术规律和健身人群的动作技能特点,为体育教学、全民健身和竞技体育水平提高服务。
参考文献
[1] 孙立新,张栩之,邓先瑞,等.自适应果蝇算法优化模糊均值聚类算法图像分割[J].控制工程,2016,23(4):494?499.
[2] 王少华,狄岚,梁久祯.基于核与局部信息的多维度模糊聚类图像分割算法[J].计算机应用,2015,35(11):3227?3231.
[3] 张杰,范洪辉.一种改进的模糊聚类图像分割算法研究与仿真[J].计算机仿真,2015,32(4):380?383.
[4] 薛艳锋,刘继华,高永强,等.一种加权模糊C均值聚类算法及其在图像分割中的应用[J].计算机应用与软件,2016,33(7): 273?277.
[5] 郑金志,郑金敏,汪玉琳.基于优化初始聚类中心的改进WFCM图像分割算法[J].软件,2015,36(4):136?142.
[6] 陈放,杨艳.基于超像素和模糊聚类的医学超声图像分割算法[J].半导体光电,2016,37(1):146?150.