标题 | 声纹识别技术在司法实践中的应用 |
范文 | 摘 要 随着科学技术的发展,声纹证据已成为公安和司法机关破案侦查的重要证据之一。实施声纹鉴定的基本要求是程序必须科学和规范。本文认为要正确提取嫌疑对象的样本,按程序审查案件检材,重视搜集和应用声纹鉴定基础资料,设计科学合理、切合实际的应用系统,采用背景音库比对模式和实时语音流监控、识别模式。深化声纹识别技术研究,在实践中逐步扩大声纹技术的识别应用范围。 关键词 声纹 识别技术 司法实践 作者简介:郑永红,湖北警官学院侦查系教授,研究方向:公安情报学。 中图分类号:D918.9 文献标识码:A DOI:10.19387/j.cnki.1009-0592.2017.10.360 随着现代科学技术的发展,声纹证据已成为公安和司法机关破案侦查的重要证据之一。声纹识别技术为案件侦查提供了关键证据和调查方向。我们应结合工作实际,努力发挥声纹识别技术的优势,努力提高工作效率。 一、声纹识别技术的发展 众所周知,每个人发声都是身体几大器官多重配合的结果,通过鼻腔、口舌、声道、胸肺最终形成看不见的声波和听得见的声音。而通常所说的声纹,是指人的声音的频谱图,是借助科学仪器描绘出来的说话人声音的图像。声纹识别技术,是一项通过语音信号提取代表说话人身份的相关特征,进而识别出说话人身份的技术 。声纹具有人的个性特征,与指纹类似。 (一)声纹识别技术的早期应用 隨着科学技术的发展,科学家们在20世纪30年代开始了说话人的识别研究。1945年,这项研究取得了突破性的进展,贝尔实验室的科学家经过多次科学实验,完成语谱图匹配,提出了“声纹”的概念。1966年,美国法院采用“声纹”取证,声纹技术开始走上了司法实践舞台。这种技术开发之初,主要秘密应用于军事情报领域,后来逐渐被司法以及金融等领域采用。 (二)我国声纹识别技术的发展 我国声纹识别技术首先是从公安、司法系统开始研究与应用。从20世纪80年代末起步的我国声纹鉴定技术的研究,至今已经取得显著成就。多种声纹智能鉴定系统,在许多案件的侦查中发挥了重大作用,其功能被人们逐渐认识。在说话人辨认领域的应用有:刑侦破案、罪犯跟踪、个性化应用等等;在说话人确认领域的应用有:银行交易、证券交易、公安取证、身份证、信用卡的认证等。 (三)声纹识别技术特点 以指纹、人脸、虹膜、语音等生理特征为识别对象的生物识别技术快速发展,在众多领域获得了应用。例如,苹果手机运用指纹识别替代密钥,一些单位的门禁系统也应用了人脸和指纹相结合的认证技术。这是因为指纹、人脸、虹膜、语音等人体生理特征具有稳定性、相对唯一性的特点,识别率较高,备受用户喜爱。美国圣何塞州立大学国家生物特性测评中心的专家曾对各种生物特征进行了比较,总结出各种生物特征在现阶段因为技术等各种原因,在易用性和应用成本上存在较大差异。如技术成熟的指纹识别因为样本采集困难,应用成本增加;虹膜、人脸识别因其技术原因易用性不强。相对而言,声纹识别的应用有一些特殊优势:语音获取自然,声纹提取便捷,识别成本低廉,适合远程身份确认,声纹辨认和确认的算法复杂度低,与说话语言、方言无关,适应人群范围很广等。 (四)声纹识别技术的两个关键问题 声纹识别的过程是先通过录音设备采集声音信号,之后利用电子设备将声音信号转换成电信号,再用信号处理算法提取音频特征,最后综合运用多种声纹识别技术来识别说话人的身份。声纹识别技术应用,需要解决两个关键问题:即特征提取和模式识别。 与语音识别不同的是,声纹识别的声纹特征必须是“个性化”特征。而这种“个性化”的根本要求在于提取对象人语音信号的基本特征,以便有效地区分不同的说话人。目前,多种声纹识别系统并存,虽各有千秋,但有一个共同点,即识别方式主要依靠声学特征进行。体现个人声学特征的是多层面的,如鼻音、带深呼吸音、沙哑音、笑声等,还有受到教育水平、出生地等环境影响的发音、言语习惯等以及个人特点,受父母影响的语调、速度、节奏等特征。声纹自动识别模型目前可以使用包括声学特征、词法特征、韵律特征、语种、方言和口音信息、通道信息等特征。 声纹识别技术要求选择适合的识别方法。声纹识别常用方法可以分为动态时间规整法、矢量量化法、隐马尔科夫模型、人工神经网络法等。近年来,一些专家在传统高斯混合模型-通用背景模型的方法上,先后提出了联合因子分析和i-vector模型 ,将说话人模型映射到低维子空间中,显著提高了声纹识别技术的性能。 二、声纹鉴定的重要环节 实施声纹鉴定的基本要求是程序必须科学和规范。声纹鉴定涉及的样本提取、检材审查、声纹鉴定数据库应用、鉴定应用系统的运用等各环节,都必须严格遵守操作程序。 (一)科学提取嫌疑对象的样本 运用先进技术进行科学采样,是声纹鉴定的首要环节。采样前要选好录音设备和地点,尽量减少和避免噪音。采样有自由交谈录音和听说录音两种。实施交谈录音时,嫌疑对象并不知晓被录音,发音自然。但是,寻找与样本相同的语句则困难较多。 听说录音则是有意让对方说与样本相同的语句,目的是为了便于对比鉴定,但嫌疑对象有的因为紧张,有的可能刻意伪装,反而增加了鉴定难度。因此,具体办案时,往往自由交谈录音和听说录音两种方式都要采用。 (二)按程序审查案件检材 声纹鉴定前,必须对案件录音检材进行审查,首先审查检材语音连续性、背景噪声连贯性、信号的波形频谱正常性,认定检材是否原件,有无经过剪辑。同时,还要注意检材的时效性。只有认定检材确为原件,没有剪辑痕迹,并且具有时效性,才可进行一定的处理。通过滤波措施和减低噪声,增强相关语音的识别度。然后,辨听检材,选定辨识性较高的语音段作为样本。根据要求,采用先进技术妥为保管样本。 (三)搜集和应用声纹鉴定基础资料 声纹特征提取是在现实环境中进行的。其环境的复杂性既包括声纹识别的说话人,也包括客观的生活环境。作为说话人,其语音声学特征不可避免地具有发展性和变异性,既便是同一个人,被采集到的两段语音内容都是相同的,但是在不同的时期或特殊的情境下,由于情绪、语速、疲劳程度等原因,声纹特征也不尽一致,语音都会有一些差异性。 因此,要随着工作任务的拓展,不断充实各种语音库,包括重点人口、不同地域、不同场合人群的语音库等。语音资料的搜集应像指纹搜集一样,结合日常工作,长期不懈地进行。语音资料的搜集应注重质量,能反映相关人的准确语音信息。语音资料的整理坚持信息化、专业化原则,形成特怔鲜明、覆盖面大、实用性强的语音资料体系。 (四)设计科学合理、切合实际的应用系统 应用现代管理理论,采用系统工程的方法和信息技术,建立层次分明、互相联系、匹配有序的系统结构。声纹识别应用系统要着眼实践工作需要,既要有全国性的声纹识别系统,也可有区域性或具体部门的小型声纹识别系统。注意各类声纹系统信息的互联互通,并同有关部门的人口管理系统、犯罪情报系统等相连接,最大限度的实现资源共享共用。充分利用各方科技人力资源,努力解决背景噪音处理、失真信号补偿和由年龄变化引起的自然变调等问题。 三、声纹鉴定的应用策略 声纹鉴定声纹识别通常有两种对比方式,即1:1和1:N方式。在案件侦查中,办案人员通过两段录音音素的对比分析,来判断两个音素是否属同一人,这也就是说话人的确认。此外,还可以运用1:N的方式来进行声纹对比,也就是说是将一个人的声音与声纹库中的声纹数据进行对比,进而找出最有可能的说话人,即判断语音是谁说的,这被称为说话人辨认。 (一) 两种对比方式 将两段语音检材直接比对应用,被称为1:1方式。在侦查中应用这种方式,可将案件现场采集到的语音检材和嫌疑录音样本进行比对,确认嫌疑人是否为作案人。这是1:1方式的应用。 人员语音库比对模式,即1:N方式。在侦查中,将案件语音检材与重点人口语音库连接、与语音库中语音模型比对,会出现在库中和不在库中两种情况。受检语音的说话人在库中,则确定匹配人,据此确定其身份。如不在库中,则采取其它措施,继续深入侦查。这种方式应用较多,如在重点人群监控、犯罪嫌疑人排查以及案件司法证据鉴定等方面。 (二)背景音库比对模式 声纹识别并不仅仅是静态检测,更多的是动态检测。背景环境复杂性和传输信道等的差异性,对语音信息会造成不同程度的影响,为声纹识别增添了不少的问题 。如何降噪以及去混响依然是声纹识别的一大难题。声纹识别的核心介质是声音,为了获取纯粹和真实声纹素材,客观上要求最大限度地降低杂音。虽然运用相关技术,能够过滤杂音,但这只是相对而言。外界的杂音干扰,很可能带来误判。为了突出说话人的声音,在一般的声纹识别中,采取技术方法降低噪声是必要的。 但是在有些案件侦查中,应用声纹识别系统又不能单纯地“去噪”。因为许多重要的办案线索很可能隐含于“噪声”之中。遇有相关案情,应在声纹鉴定前,先对背景声音进行分离和鉴别。如在绑架案的侦查中,通过音频资料的鉴定,便可以从各种噪声中,发现案发时间、地点及相关人员的重要线索。 (三)实时语音流监控、识别模式 近年来,各地公安部门结合工作实际,努力发挥声纹识别技术的优势,有力地维护了社会治安。一些地方公安部门的声纹鉴定系统与相关部门监控、采集设备结合使用,运用实时语音流监控、识别系统,发挥出重要作用。只要“犯罪嫌疑人”接通电话,通过监控、识别系统同“犯罪嫌疑人”的语音样本比对,便可迅速提供通话人身份、地点等信息,为破案提供了重要线索。有的地方公安机关建立了“110”报警声纹采集与辅警系统,也取得了较好的社会效益。 总之,应加强总体规划,加强专业技术队伍建设,深化包括声纹识别在内的生物特征识别技术研究,进一步建立和健全相应的声纹库,在实践中逐步扩大声纹技术的识别应用范围,为提高破案率提供技术支撑。声纹识别技术与其它高新技术高度融合是未来的发展趋势,如大数据、物联网、人工智能以及地理信息技术、虚拟现实技术、区块链和深度学习等技术,都可与声纹识别技术加以融合,大大提升声纹识别的精确性。 注释: 陈拥权、张羽、胡翀豪、楚瑾.声纹识别技术及其应用前景分析.网络安全技术与应用.2013,11(24). Dehak N,Kenny P,Dehak R,et al.Front-end factor analysis for speaker verification.IEEE Trans on Audio,Speech,and Language Processing,2011,19(4). 鄭方、李蓝天、张慧、艾斯卡尔·肉孜.声纹识别技术及其应用前景.信息安全研究.2016,1(44-57). |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。