《基于SVM算法的猪声音识别的研究》-工学论文，计算机论文-论文范文参考-科学狗论文网

标题

基于SVM算法的猪声音识别的研究

范文

张栖铭　袁瑞临　范凡　王峰

摘要：為了实现猪只不同状态下的自动检测，试验采用声音识别技术，设计了基于支持向量机算法（SVM）的声音识别方法，首先通过短时过零率和短时能量的端点检测，确定猪只不同状态的声音信号的起始点和终止点，然后提取声音信息的梅尔频率倒谱系数作为特征参数，使用SVM算法进行训练，建立声音的分类模型，最后对猪只不同状态进行识别。结果表明：猪只状态识别精度较高，达到了预期效果。

关键词：声音识别；SVM；MFCC；端点检测

中图分类号：TP391

文献标识码：A

文章编号：1009-3044（2017）10-0162-03

动物发声是动物行为的一种方式，可以通过叫声与其他成员进行有效交流，它能反映动物的生理状况如饥饿、疼痛、情绪状态等，因而基于动物声音的状态识别是有一定事实基础的。并且，随着计算机技术和数字信号处理技术的发展，声音识别技术已经取得了显著进步，动物的声音识别技术也得到了一定的发展。

因为猪只的声音信息可以很好的反馈猪只的状态，因此，本试验采用梅尔倒谱系数（MFCC）作为猪只声音的特征参数，然后将提取的特征参数，用来建立支持向量机（SVM）的分类模型，最后对不同状态的猪只声音进行识别，为规模化的养猪业提供客观的猪只状态监测。

1.算法介绍

1.1声音信号的端点检测

端点检测，声音处理中的一个重要方面，其作用是从包含声音的一段信号中确定出声音的起始点及终止点，区分声音和非声音信号。有效的端点检测不仅可以减少数据处理量，节约时间，而且能抑制无声段或噪声段的干扰，提高声音信号质量。利用短时能量和短时过零率进行双门限的端点检测。

短时能量是声音的一个重要的特性，对声音的能量分析主要集中在短时能量上。短时能量的定义如下：

1.2声音识别特征参数的提取（MFCC）

声音信号特征的梅尔倒谱系数（MFCC）法，是基于听觉特性的特征参数：不同频率的声音，在人耳内基础膜的不同位置振动。所以人耳就可以很容易辨别出各种状态的声音，此参数作为猪声音的识别参数能更好地反应各种声音信号的特性，从而极大地提高整个系统鲁棒性和系统的识别率。

MFCC参数主要描述了声音信号在频域的能量分布，Mel频率的大小与实际频率呈对数分布。下式即为Mel频率与声音频（Hz）的关系式：

以两种猪只状态的声音为例，得到MFCC参数如图1，可以从图中看出，不同状态的猪只声音的特征参数有明显的区别，用此参数可以区别不同猪只状态。

1.3SVM算法

支持向量机（Support Vector Machine，SVM）是Vapnikm等人提出的一类新型机器学习方法。由于支持向量机在解决小样本问题、非线性问题及高维空间内的模式识别问题的时候有很多优点，所以其被广泛使用。

目前实行支持向量机的软件方法有Libsvm、Liblinear、mvs-VM、SVMlight等方法。中国台湾大学的林智仁（Chih-Jen Lin）教授等人设计了Libsvm软件，已经在多个操作系统平台上实现了支持向量机。该软件整合了交叉验证（Cross-Validation）的功能，能够方便地优化参数。利用Libsvm可以解决C支持向量分类机、v支持向量分类机、s支持向量回归机和v支持向量回归机等问题，以及基于1-v-1算法的多分类问题。

本试验中支持向量机采用的是Libsvm算法。Libsvm算法中的训练分类函数可以选择支持向量机的不同训练模式，其中，Option参数为训练分类模型的参数。可用选项即表示涵义如下：

2.实现猪只状态的识别

猪只的患病、争斗以及食欲情况都反映其生理健康状况。试验根据畜牧养殖从业人员的实际经验，选取了5种可以体现上述行为状态的猪只声音信息：小猪被压、猪打架、猪饥饿、猪吃料、猪咳嗽，作为本次试验的声音样本。

2.1猪声音识别流程

将采集到的五种猪只声音，一部分作为训练集，首先对声音信息进行预处理，即预加重、分帧、加窗；然后对声音进行双门限的端点检测，确定声音的起始点；将处理后的声音通过mel倒谱系数法提取声音特征值。将提取到的特征值通过SVM算法训练得到分类模型（model）。将其中一种猪只声音作为测试集，通过MFCC特征提取后，使用SVM算法分类预测出猪只状态。

图2是猪声音识别流程。

2.2程序分析结果

Option选项中，-c和-g决定了分类效果，通过交叉验证选择最佳参数-c和-g。我们得到的最佳参数是：

-c=0.125；-g=0.0078125。

采用参数-c与-g对整个训练集进行训练获取支持向量机模型；训练得到的model参数：

分类模型（model）中主要参数说明：

（1）model.Parameters参数分别表示为：-s参数为0，为C-SVC函数；一t参数为2，采用RBF函数；-d参数为3；-gr（gama）为0.0078（优化得到的参数）；-r coefO参数为0.

（2）model.Label表示训练数据的分类标签，本试验采用的是l，2，3，4，5。

（3）model.nr_class表示训练数据的分类个数，本试验是五分类。

（4）model.totalSV表示训练样本共有的支持向量数目，试验结果表明，共有1476个支持向量。

（5）model.nSV表示每类训练样本的支持向量的数目，分别是：标签为1的训练样本的支持向量数目有313个，标签为2的训练样本的支持向量数目有299个，标签为3的训练样本的支持向量数目有372个，标签为4的训练样本的支持向量数目有364个，标签为5的训练样本的支持向量数目有128个。

通过svmpredict函数对测试集进行识别预测。得表2识别结果，包含待识别猪只状态和识别准确率。

3.结论

试验设计了一种基于声音的猪只状态识别方法，通过短时能量和短时过零率的端点检测，选择梅尔倒谱系数作为声音特征参数，以SVM算法作为分类器识别预测5种状态下的猪只异常声音，识别准确率较高。但本试验训练数据不足，且预测环境较为理想，因此有很多地方需要改进。一方面需要增加训练数据量，另一方面，进一步研究现场环境中混杂在一起的各种猪声音以及噪音的问题，通过以上方法来提高系统的准确率及实用性。

随便看

科学优质学术资源、百科知识分享平台，免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。