音乐表演声准校对平台的设计与实现
韦民
摘 要: 传统的校对方法使用的是对比模型标准校对,在校对过程中经常出现同频音质的失真现象,并且很大程度上存在音频回响,极大地影响了音乐表演的效果,对此,设计一种音乐表演声准校对平台。在硬件的设计过程中使用了声音数据分析服务器能够有效地对音频数据进行高振感隔离,音频信号采集器选用MPEG?700型号的音频信号采集器,对音频分类器的设计选用两种分类器。分别是统分类器以及隐马尔可夫模型分类器。在软件设计上对预加重处理计算过程中引入线性预测编码系数,对设计音乐表演声准校对平台进行多模式校对,改变传统统一校对模式,实现音乐表演声准自动校对。为了保证设计的合理性以及有效性,模拟应用环境进行对比试验可知,设计的音乐表演声准校对平台能对不同音频数据进行标准校对。
关键词: 音乐表演; 声准校对平台; 平台设计; 音频数据隔离
中图分类号: TN99?34; TP311 文献标识码: A 文章编号: 1004?373X(2017)20?0034?03
Abstract: During the process of traditional standard proofreading using the contrast model, the same frequency tone quality is often distorted and audio response is generated to a large extent, largely affecting the effect of music performance. Therefore, an intonation proofreading platform for music performance is designed. In the hardware design, the sound data analysis server is used to effectively isolate audio data from high vibration, the MPEG?700 audio signal collector is chosen, and two types of audio classifiers (EC classifier and hidden Markov model classifier) are designed. In the software design, linear prediction encoding coefficient is introduced in the process of pre?emphasis calculation to perform multi?mode proofreading for the designed intonation proofreading platform for music performance, change the traditional unified proofreading mode, and realize automatic intonation proofreading in music performance. In order to ensure the rationality and effectiveness of the design, the comparative experiment was carried out in the simulated application environment. The results show that the designed intonation proofreading platform for music performance can perform standard proofreading for different audio data.
Keywords: music performance; intonation proofreading platform; platform design; audio data isolation
0 引 言
随着语音识别技术的发展, 声准校对模型在音乐表演的领域取得了极大的成就。通过分析服务器采集到的音乐表演声音,使用波形图来进行声音的校准。传统的校对方法使用的是对比模型的标准校对,但是在校对过程中经常出现同频音质的失真现象,并且很大程度上存在音频回响[1]。针对上述问题的产生,提出一种音乐表演声准校对平台。并进行实验分析,结果表明,提出的音乐表演声准校对平台能够避免校对过程中出现同频音质的失真现象,并且减少音频回响,保证了设计的音乐表演声准校对平台在校对过程中聲音的清晰度。
1 硬件系统
本文设计的音乐表演声准校对平台考虑到了使用情况,同时考虑到校准声音环境因素的限制[2],设计出硬件结构总体框架,从音频服务器终端采集到的声音,通过音频识别器分析后,传到校对数据端和校对终端。音乐表演声准校对平台硬件结构如图1所示。
1.1 声音数据分析服务器
声音数据分析服务器是整个音乐表演声准校对系统的核心设备,负责整个系统的数据采录和数据处理,采录过程采用的是 MPEG?4 压缩格式,各路的压缩码流可选[3]。根据音乐表演的不同方式,对表演的采录时间可以选择单独设置声音数据分析服务器。主要是根据样本库中音准分析,从而能够有效地对音频数据进行高振感隔离,并且保证了同频音质的清晰度。
1.2 音频信号采集站
本文设计的音频信号采集站可以同时对多场音乐表演进行采录。在采录过程中,界面实时显示音频信号的视频图像,同时可以对音频信号进行音准监听。为了保证采录的声音质量,可以对各路信号的混响、音色、明暗度、声音的饱和度等参数进行单独调节[4]。采录的音频文件,也将自动发送到文件服务器。
1.3 音频分类器设计
分类器的作用是通过声音的特征向量进行某种变换和映射,将声音特征向量从声音特征空间映射到目标声音类型空间,从而得到识别结果。本文设计使用隐马尔可夫模型分类器,其作为现代音频信号处理中的一种统计模型,在音频信号处理的各个领域中得到了广泛的应用[5?6]。隐马尔可夫模型在现实问题中,经常是观察到的事件要通过一组概率分布来对应,这就是隐马尔可夫模型。它是一种双重随机过程,反映的是状态的转移,但状态转移是隐式的,是不可直接观测的,所以配合统分类器来间接地观测得到。这样能够把高音与低音进行分离处理,保证校准过程的准确性,同时提高声音质感[7]。
2 软件设计
本文设计的音乐表演声准校对平台,在软件设计上主要是针对两大方面进行设置,一是预加重处理设计方案,二是引入线性预测编码系数(PPCM)。对于关系系统要实现数据的实时传输以及更新,对于声准校对平台要保证校对过程的准确性,同时保证了同频音质清晰度[8]。
2.1 预加重处理设计方案
本文设计的音乐表演声准校对平台,在软件系统上主要实现声音校对过程预加重处理,使其变得更加有序化,首先对采录到的声音进行数据处理,过程如下:
2.2 引入线性预测编码系数
音乐表演声准校对平台最主要的作用是音频校准,本文设计的音乐表演声准校对平台主要针对音乐表演校准。音乐表演特点是音调变化较多[9],需引入线性预测编码系数(PPCM),针对使用情况对声准校对进行设置,过程如下:
3 仿真实验
3.1 参数设定
本文设计音乐表演声准校对平台,对参数进行设定,设置[cfg]频率相关常量的值域为[1 000,1 250]。本文对音乐表演现场进行试验,因此频率相关常量存在一定数据波动,波动频率如图3所示。
3.2 音樂表演声准误差调节
为了保证本文设计的音乐表演声准校对平台的有效性,需要对实验数据进行误差调节设定,其设定数据如表1所示。
3.3 结果对比分析
分析图4结果得知,本文设计的音乐表演声准校对平台,在声准还原校准度上明显高于传统校对方法。可以看出,设计音乐表演声准校对平台能对不同的音频数据进行标准校对。
4 结 语
本文设计一种音乐表演声准校对平台,并为保证设计合理性及有效性,模拟应用环境进行对比试验。通过对实验数据有效分析可知,设计的音乐表演声准校对平台能对不同音频数据进行标准校对。
参考文献
[1] 付雯,李响.基于三维图像校对的食品机械加工对接平台设计[J].食品与机械,2015(5):153?156.
[2] 吕一博,蓝清,韩少杰.基于Android和IOS移动终端的作者远程校对方法[J].中国工业经济,2015(5):148?160.
[3] 文凯,张润,王尚波.基于Hi3531的NVR软件平台的设计与实现[J].电视技术,2015,39(1):65?67.
[4] 郝冬青,刘琰.SAR成像在DSP平台上的算法设计和实现[J].计算机仿真,2016,33(11):5?8.
[5] 谈大勇.基于“互联网+”的出版物在线校对平台运行的SWOT分析[J].大庆师范学院学报,2016,36(3):73?76.
[6] LIN B, PEI Y, YIN L, et al. Design and efficient hardware implementation schemes for non?quasi?cyclic LDPC codes [J]. Tsinghua science & technology, 2017, 22(1): 92?103.
[7] 陈秋菊,李应.基于优化正交匹配追踪和深度置信网的声音识别[J].计算机应用,2017,37(2):505?511.
[8] 周晓敏,李应.基于小波矩和BP网络的声音识别[J].计算机工程与应用,2015,51(3):192?196.
[9] 李应,陈秋菊.基于优化的正交匹配追踪声音事件识别[J].电子与信息学报,2017,39(1):183?190.
摘 要: 传统的校对方法使用的是对比模型标准校对,在校对过程中经常出现同频音质的失真现象,并且很大程度上存在音频回响,极大地影响了音乐表演的效果,对此,设计一种音乐表演声准校对平台。在硬件的设计过程中使用了声音数据分析服务器能够有效地对音频数据进行高振感隔离,音频信号采集器选用MPEG?700型号的音频信号采集器,对音频分类器的设计选用两种分类器。分别是统分类器以及隐马尔可夫模型分类器。在软件设计上对预加重处理计算过程中引入线性预测编码系数,对设计音乐表演声准校对平台进行多模式校对,改变传统统一校对模式,实现音乐表演声准自动校对。为了保证设计的合理性以及有效性,模拟应用环境进行对比试验可知,设计的音乐表演声准校对平台能对不同音频数据进行标准校对。
关键词: 音乐表演; 声准校对平台; 平台设计; 音频数据隔离
中图分类号: TN99?34; TP311 文献标识码: A 文章编号: 1004?373X(2017)20?0034?03
Abstract: During the process of traditional standard proofreading using the contrast model, the same frequency tone quality is often distorted and audio response is generated to a large extent, largely affecting the effect of music performance. Therefore, an intonation proofreading platform for music performance is designed. In the hardware design, the sound data analysis server is used to effectively isolate audio data from high vibration, the MPEG?700 audio signal collector is chosen, and two types of audio classifiers (EC classifier and hidden Markov model classifier) are designed. In the software design, linear prediction encoding coefficient is introduced in the process of pre?emphasis calculation to perform multi?mode proofreading for the designed intonation proofreading platform for music performance, change the traditional unified proofreading mode, and realize automatic intonation proofreading in music performance. In order to ensure the rationality and effectiveness of the design, the comparative experiment was carried out in the simulated application environment. The results show that the designed intonation proofreading platform for music performance can perform standard proofreading for different audio data.
Keywords: music performance; intonation proofreading platform; platform design; audio data isolation
0 引 言
随着语音识别技术的发展, 声准校对模型在音乐表演的领域取得了极大的成就。通过分析服务器采集到的音乐表演声音,使用波形图来进行声音的校准。传统的校对方法使用的是对比模型的标准校对,但是在校对过程中经常出现同频音质的失真现象,并且很大程度上存在音频回响[1]。针对上述问题的产生,提出一种音乐表演声准校对平台。并进行实验分析,结果表明,提出的音乐表演声准校对平台能够避免校对过程中出现同频音质的失真现象,并且减少音频回响,保证了设计的音乐表演声准校对平台在校对过程中聲音的清晰度。
1 硬件系统
本文设计的音乐表演声准校对平台考虑到了使用情况,同时考虑到校准声音环境因素的限制[2],设计出硬件结构总体框架,从音频服务器终端采集到的声音,通过音频识别器分析后,传到校对数据端和校对终端。音乐表演声准校对平台硬件结构如图1所示。
1.1 声音数据分析服务器
声音数据分析服务器是整个音乐表演声准校对系统的核心设备,负责整个系统的数据采录和数据处理,采录过程采用的是 MPEG?4 压缩格式,各路的压缩码流可选[3]。根据音乐表演的不同方式,对表演的采录时间可以选择单独设置声音数据分析服务器。主要是根据样本库中音准分析,从而能够有效地对音频数据进行高振感隔离,并且保证了同频音质的清晰度。
1.2 音频信号采集站
本文设计的音频信号采集站可以同时对多场音乐表演进行采录。在采录过程中,界面实时显示音频信号的视频图像,同时可以对音频信号进行音准监听。为了保证采录的声音质量,可以对各路信号的混响、音色、明暗度、声音的饱和度等参数进行单独调节[4]。采录的音频文件,也将自动发送到文件服务器。
1.3 音频分类器设计
分类器的作用是通过声音的特征向量进行某种变换和映射,将声音特征向量从声音特征空间映射到目标声音类型空间,从而得到识别结果。本文设计使用隐马尔可夫模型分类器,其作为现代音频信号处理中的一种统计模型,在音频信号处理的各个领域中得到了广泛的应用[5?6]。隐马尔可夫模型在现实问题中,经常是观察到的事件要通过一组概率分布来对应,这就是隐马尔可夫模型。它是一种双重随机过程,反映的是状态的转移,但状态转移是隐式的,是不可直接观测的,所以配合统分类器来间接地观测得到。这样能够把高音与低音进行分离处理,保证校准过程的准确性,同时提高声音质感[7]。
2 软件设计
本文设计的音乐表演声准校对平台,在软件设计上主要是针对两大方面进行设置,一是预加重处理设计方案,二是引入线性预测编码系数(PPCM)。对于关系系统要实现数据的实时传输以及更新,对于声准校对平台要保证校对过程的准确性,同时保证了同频音质清晰度[8]。
2.1 预加重处理设计方案
本文设计的音乐表演声准校对平台,在软件系统上主要实现声音校对过程预加重处理,使其变得更加有序化,首先对采录到的声音进行数据处理,过程如下:
2.2 引入线性预测编码系数
音乐表演声准校对平台最主要的作用是音频校准,本文设计的音乐表演声准校对平台主要针对音乐表演校准。音乐表演特点是音调变化较多[9],需引入线性预测编码系数(PPCM),针对使用情况对声准校对进行设置,过程如下:
3 仿真实验
3.1 参数设定
本文设计音乐表演声准校对平台,对参数进行设定,设置[cfg]频率相关常量的值域为[1 000,1 250]。本文对音乐表演现场进行试验,因此频率相关常量存在一定数据波动,波动频率如图3所示。
3.2 音樂表演声准误差调节
为了保证本文设计的音乐表演声准校对平台的有效性,需要对实验数据进行误差调节设定,其设定数据如表1所示。
3.3 结果对比分析
分析图4结果得知,本文设计的音乐表演声准校对平台,在声准还原校准度上明显高于传统校对方法。可以看出,设计音乐表演声准校对平台能对不同的音频数据进行标准校对。
4 结 语
本文设计一种音乐表演声准校对平台,并为保证设计合理性及有效性,模拟应用环境进行对比试验。通过对实验数据有效分析可知,设计的音乐表演声准校对平台能对不同音频数据进行标准校对。
参考文献
[1] 付雯,李响.基于三维图像校对的食品机械加工对接平台设计[J].食品与机械,2015(5):153?156.
[2] 吕一博,蓝清,韩少杰.基于Android和IOS移动终端的作者远程校对方法[J].中国工业经济,2015(5):148?160.
[3] 文凯,张润,王尚波.基于Hi3531的NVR软件平台的设计与实现[J].电视技术,2015,39(1):65?67.
[4] 郝冬青,刘琰.SAR成像在DSP平台上的算法设计和实现[J].计算机仿真,2016,33(11):5?8.
[5] 谈大勇.基于“互联网+”的出版物在线校对平台运行的SWOT分析[J].大庆师范学院学报,2016,36(3):73?76.
[6] LIN B, PEI Y, YIN L, et al. Design and efficient hardware implementation schemes for non?quasi?cyclic LDPC codes [J]. Tsinghua science & technology, 2017, 22(1): 92?103.
[7] 陈秋菊,李应.基于优化正交匹配追踪和深度置信网的声音识别[J].计算机应用,2017,37(2):505?511.
[8] 周晓敏,李应.基于小波矩和BP网络的声音识别[J].计算机工程与应用,2015,51(3):192?196.
[9] 李应,陈秋菊.基于优化的正交匹配追踪声音事件识别[J].电子与信息学报,2017,39(1):183?190.