改进极限学习机的电子音乐分类模型

赵亮



摘 要: 针对传统模型无法准确实现电子音乐分类和识别的难题,提出改进极限学习机的电子音乐分类模型。首先对电子音乐数据进行采集,并提取其倒谱系数特征,并采用核主成分分析对特征进行筛选;然后采用遗传算法对极限学习机的参数进行选择,并用于构建电子音乐的分类器;最后采用多种类型的电子音乐进行仿真实验,改进极限学习机的电子音乐平均分类率达到了95%以上,电子音乐的错分率要远远低于当前其他电子音乐分类模型。实验结果验证了该电子音乐分类模型的可行性以及优越性。
关键词: 音乐分类; 核主成分分析; 极限学习机; 音乐特征; 遗传算法
中图分类号: TN912.3?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)05?0155?04
Abstract: It is difficult to class and recognize the electronic music with the traditional model accurately, a new electronic music classification model based on improved extreme learning machine is proposed. The electronic music data is collected to extract the feature of the cepstrum coefficient. The kernel principal component analysis is used to screen the feature. The genetic algorithm is used to select the parameters of the extreme learning machine to construct the classifier of the electronic music. The polytype electronic music is adopted to carry out the simulation experiments. The average classification rate of the electronic music can reach up to 95% with the improved extreme learning machine, and the wrong classification rate of the electronic music is far lower than that of other electronic music classification models. The feasibility and superiority of the electronic music classification model were verified with the experimental results.
Keywords: music classification; kernel principal component analysis; extreme learning machine; music characteristic; genetic algorithm
0 引 言
隨着信息技术的不断发展,与音乐的结合更加紧密,出现了许多种类的电子音乐,电子音乐可以减轻人们生活、工作上的压力,然而每一个用户喜欢的电子音乐类型不同,如何从海量的电子音乐库准确找到用户喜欢的音乐十分重要[1]。电子音乐分类是提高电子音乐查询效率的关键,成为人们关注的焦点[2]。
电子音乐分类研究可以划分为两个阶段:传统阶段和现代阶段,传统阶段是一种人工分类方式,通过一些专家和专业人员对电子音乐进行分析,将它们划分到相应的类别中[3]。当电子音乐的数据很小时,传统分类方法的分类准确率高,可以很好地对分类结果进行解释。随着音乐数据的不断增加,传统方法的缺陷逐渐体现出来,出现了误分率高,分类效率低等不足[4]。现代阶段主要通过计算机实现电子音乐的自动分类[5]。电子音乐自动分类属于一种模式识别问题,它首先要提取反映电子音乐的特征信息,然而原始特征数量相当庞大,直接根据原始特征信息进行电子音乐自动分类的时间长、效率低,为此通常对电子音乐的原始特征进行筛选,当前采用主成分分析对特征进行处理,降低特征的数量,加快电子音乐自动分类的速度[6]。主成分分析属于线性处理方法,不能有效提取描述电子音乐标签的非线性信息[7]。核主成分分析是一种改进的主成分分析方法,通过引入核函数提取非线性信息,获得了比主成分分析更优的特征[8]。电子音乐自动识别也需要设计电子音乐分类器,当前主要有隐马尔可夫模型、神经网络和支持向量机[9?11],然而这些方法均存在一些不足,如隐马尔可夫模型只能进行线性分类,电子音乐分类的结果不可靠;人工神经网络虽然能够对电子音乐进行非线性分类,但要求电子样本数据充足,一旦不能满足样本充足这个条件,电子音乐分类效果急剧下降;支持向量机虽然没有神经网络对样本数据的要求,但学习过程繁锁,时间复杂度高,不能满足海量电子音乐分类的速度要求[12]。
针对传统模型在电子音乐分类过程中存在的不足,提出了改进极限学习机的电子音乐分类模型。首先提取电子音乐的倒谱系数特征,采用核主成分分析选择电子音乐的特征,然后改进极限学习机构建电子音乐的分类器,最后仿真实验结果表明,改进极限学习机提高了电子音乐的平均分类率,电子音乐分类性能优于其他模型。
1 改进极限学习机的电子音乐分类模型
1.1 提取电子音乐的特征
当前电子音乐有很多种特征来描述其类型,而电子音乐实际是一种声音,Mel倒谱系数可以描述声音频率的能量变化,提取特征速度很快,为此本文选择Mel倒谱系数作为电子音乐分类的特征,具体步骤如下:
(1) 对采集的电子音乐数据进行分帧处理,去除无效帧。
(2) 采用傅里叶变换对电子音乐的帧信号进行处理,得到它们的幅度频谱。
(3) 通过幅度频谱的Mel尺度变换,并采用滤波器组对频谱进行滤波处理,得到第[j]个滤波器的能量值为:
1.3 改进极限学习机
为了解决传统神经网络收敛速度慢,易产生过拟合、网络结构复杂的缺陷,Huang等提出了极限学习机,只要简单的随机设置权值和阈值,而且只要确定隐含层的节点数,便可以顺利完成训练过程,得到求解问题的最优解[13]。设隐含层的节点数为[L,]那么极限学习机的输出函数为:
在极限学习机的工作过程中,参数[ai,bi]直接影响其学习性能,为了解決该问题,本文采用遗传算法确定极限学习机的参数,具体如图1所示。
1.4 改进极限学习机的电子音乐分类步骤
(1) 收集电子音乐样本数据,组成电子音乐数据库。
(2) 提取电子音乐数据库的特征,它们组成特征向量库。
(3) 对电子音乐数据库中的特征进行归一化处理。
(4) 采用核主成分分析选择电子音乐数据库的特征,组成最优特征子集。
(5) 根据最优特征子集对训练样本和测试样本进行降维处理,减少数据的规模。
(6) 将训练样本输入到极限学习机中进行学习,采用遗传算法确定最优极限学习机参数。
(7) 根据最优参数,极限学习建立电子音乐分类模型。
(8) 采用电子音乐的测试数据对电子音乐分类模型的性能进行测试与分析。
2 电子音乐分类的性能测试
2.1 电子音乐数据的来源
为了分析改进极限学习机的电子音乐分类效果,选择大量数据进行仿真测试,该数据可分为4种类型的电子音乐,它们分别为:古筝、琵琶、笛子、箜篌,它们的样本数量分布如表1所示。为了使IELM的电子音乐分类效果具有可比性,设计了2种对比模型,具体描述如下:
(1) 主成分分析+ELM的电子音乐分类模型(PCA?ELM)。
(2) 核主成分分析+支持向量机的电子音乐分类模型(KPCA?SVM)。
2.2 结果与分析
每一种模型运行10次,计算它们的平均值,KPCA?ELM与对比模型的电子音乐分类正确率、错误分类率与平均训练时间(单位:s)如图2~图4所示。
对图2~图4进行分析可知:
(1) 相对于PCA?ELM,KPCA?ELM的电子音乐分类率得到了提高,而且错误分类率更小,这是因为KPCA可以提取比PCA更好的非线性特征,使得特征可以更加准确地反映电子音乐的类型。
(2) 相对于KPCA?SVM,KPCA?ELM的电子音乐分类率同样得到了改善,有效降低了电子音乐的错误分类率,这是因为ELM集成了传统神经网络和支持向量机的优点,建立了性能更优的电子音乐分类模型。
(3) 在所有电子音乐分类模型中,KPCA?ELM的电子音乐分类训练最少,这是因为KPCA可以有效减少特征维数,而且ELM可以获得比支持向量机更快的学习速度,加快了电子音乐分类的训练速度,提高了电子音乐的分类效率,更加适合于海量电子音乐分类的要求。
3 结 语
电子音乐分类可以拓宽多媒体的应用范围,具有十分重要的应用价值。为了解决当前电子音乐分类模型存在的不足,本文提出了改进极限学习机的电子音乐自动分类模型,该模型集成了核主成分分析和极限学习机的优点,同时采用遗传算法对极限学习机参数进行选择,提高了电子音乐分类的准确性,具有广泛的应用前景。
参考文献
[1] TZANETAKIS G, COOK E. Musical genre classification of audio signals [J]. IEEE transactions on speech & audio proces?sing, 2001, 10(5): 293?302.
[2] COSTA Y M G, OLIVEIRA L S, KOEFICH A L, et a1. Music genre classification using LBP textural features [J]. Signal processing, 2012, 92(11): 2723?273.
[3] 邹昊.基于概率神经网络的流行音乐分类研究[J].北方音乐,2015,35(16):44.
[4] 张宝印,于俊清,唐九飞,等.面向情感的电影背景音乐分类方法[J].计算机科学,2013,40(12):37?41.
[5] 韩浩,王寅潇,王博,等.基于概率神经网络的流行音乐分类研究[J].数字技术与应用,2013(8):64?65.
[6] 高林杰,张 明.基于熵和支持向量机的音乐分类方法[J].计算机系统应用,2014,23(5):83?67.
[7] 张燕,唐振民,李燕萍,等.基于MFCC和 HMM的音乐分类方法研究[J].南京师范大学学报(工程技术版),2008(4):112?114.
[8] 胡景凯,吴磊,高阳.基于学习分类器(LCS)的MP3音乐分类方法[J].重庆邮电大学学报(自然科学版),2007(4):417?421.
[9] 张家发,胡景凯,高阳,等.基于MDCT域特征的MP3音乐分类[J].江南大学学报(自然科学版),2007(6):769?773.
[10] 李剑.神经网络在音乐分类中的应用研究[J].江南大学学报(自然科学版),2010,27(11):168?170.
[11] 孟永辉,蒋冬梅,付中华,等.一种新颖的语言/音乐分割与分类方法[J].计算机工程与科学,2009,31(4):106?109.
[12] 刘建辉,曾丽辉,许金凤,等.基于最小二乘支持向量机的乐器音乐分类[J].华东交通大学学报,2009,26(6):60?64.
[13] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1): 489?501.