网站首页  词典首页

请输入您要查询的论文:

 

标题 基于内容下音乐检索方法的比较研究
范文

    王楠鑫 张雨佳

    【摘要】音乐为音频数据的一种,提高音频数据检索效率,是改善用户检索体验的主要途径。本文从音乐内容入手,阐述了基于内容的音乐检索处理框架。基于此,重点对端点检测方法,以及语音识别方法进行了比较研究。并根据研究结果,设计了一种基于内容的音乐检索系统。通过对系统检索效果的观察,证实了系统的应用价值。以期能够为有关人员提供参考。

    【关键词】音乐内容;检索方法;端点检测;语音识别;优化设计

    【中图分类号】J605 【文献标识码】A

    一、基于内容的音乐检索处理框架

    音乐检索的本质,即模仿人的大脑,对声音进行分析。在此基础上,根据旋律以及节奏的快慢,对音乐加以分辨的过程。为确保基于内容的音乐检索有效实现,准确提取歌曲节奏的特征数据,对提取歌曲的基音数据进行对比较为关键。具体处理框架,既“特征提取--检索引擎--查询结果/继续提取特征”的这一过程。系统接收到信息后,会对用户声音的特征进行提取。采用匹配算法,将用户的声音,与系统中音乐的声音进行匹配,最终将匹配结果,反馈给用户。将上述检索方法应用到音乐检索过程中,使用户在了解音乐特征的基础上,实现对音乐的查找。对改善用户检索体验,具有较高的实践价值。

    二、基于内容的音乐检索方法的比较及优化

    (一)端点检测方法

    端点检测算法,包括门限法端点检测、噪音检测以及动态窗长语音检测三种。以动态窗长语音检测为例,当开始检测时,如动态窗较长,检测系统可随之进入到過渡段,反复检测,即可准确的判断出语音的起始点,进而实现对音乐的检索。如动态窗较短,则可经由起始点,回到正常窗,实现对音乐的检索。与英语不同,汉子语音末尾,多为浊音。因此,仅采用短时的能量,即能够判断出语音的结尾点,使基于内容的音乐检索的过程得以实现。

    用户可将动态窗长语音检测算法,应用到音乐的检索过程中,对用户的哼唱音频进行检索。假设用户的哼唱音,为“do、re、mi、fa”,系统可根据对哼唱音频短时能量的观察,对短时过零率进行计算。鉴于“fa”中,“f”为清音。因此,如用户发声时声带未振动,而是产生的收缩。则“fa”的短时能量,通常会有所降低。但该特征,不会对哼唱的过零率产生影响。因此,用户采用端点检测方法,以内容为基础对音乐进行检索,可取得较好的效果。

    (二)语音识别方法

    语音识别属于模式识别的一种,为确保用户的语音能够被识别,机器必须具备一定的“理解”以及“响应”能力。目前常用的语音识别技术,主要包括特征提取技术以及模式匹配准则等。各技术的应用,均需经过“选取语音识别单元”的过程。该过程中如下:预处理--提取特征--训练--模式识别(存储至模式库)--结束识别。即当用户的语音信息,被系统接收后,系统可随之对其进行预处理。并在提取语音数据特征的基础上,对其进行训练。被处理后的语音数据,经模式识别后,既可得到检索结果。

    将语音识别方法,应用到基于内容的音乐检索过程中,同样可检索出用户所需的音乐。用户哼唱歌谱时,常用音主要包括“do、re、mi、fa、sol、la、si”共7个。根据音高的不同,各音的特征同样有所差异。假设语音识别方法仅能够识别出音符,而无法识别音高,则检索所得到的结果,准确度通常会存在一定的误差。为解决上述问题。将低音组音阶,与高音组音阶,共同影射为14个字符。在此基础上,实现对音高特征的识别,既能够得到更加精准的识别结果,进而使音乐检索效率得以提升。

    (三)音乐检索方法的优化

    端点检测方法,以及语音识别方法,在基于内容的音乐检索过程中,均具有各自的应用优势。将两者的优势相结合,对音乐检索系统进行设计,可有效优化系统的检索性能。本课题所设计的音乐检索系统,功能主要包括“源音乐库存储功能”“人声端点检测功能”以及“旋律特征提取功能”三种。当用户哼唱一段旋律后,系统会随之对所采集到的哼唱数据的旋律特征进行提取,并以音频为准,检索旋律的特征。当明确音乐特征后,系统会随之将其与源音乐库中的音乐进行对比。对比无误后,既可显示出检索结果。

    为判断系统是否能够达到优化音乐检索性能的目的,本课题对不同检索方法的检索成功率进行了对比。将同样的用户哼唱音频,分别采用不同的方法检索后发现:端点检测法。34段用户哼唱音频中,共30例被成功检索,检索准确度为88.23%;语音识别法。34段用户哼唱音频中,共29例被成功检索,检索准确度为85.29%;本系统功能。34段用户哼唱音频中,共34例被成功检索,检索准确度为100%。对比发现,将两种检索方法,共同应用到音乐检索过程中,准确度更高。

    三、结论

    综上所述,基于内容的音乐检索方法,主要包括端点检测法,与语音识别法两种,两者各有其优势。设计人员可充分利用两种检测方法在检索音乐方面存在的优势,设计更好的系统,实现对音乐的检索。

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/2/6 8:42:24