麦克风树声源定位

2023.09.06

董晓红康平

摘?要：声源定位技术是当今人们研究的热门问题，广泛应用于医疗、交通、雷达、远程会议、航天、机器人等先进领域。其原理是通过麦克风来获取语音信号，分析并处理数字信号，来确定声源的位置。本文用麦克风树时延估计声源定位法确定声源的位置。先介绍麦克风树的原理，按照麦克风树离声源的远近，将模型分类。

关键词：麦克风树;近场模型;远场模型

1 问题分析

语音信号通过麦克风拾取，然后通过数字信号处理技术把拾取出的语言信号进行处理和分析，来确定声源的位置。通常使用单个麦克风来识取，但其拾音范围很有限，拾取信号的效果不是很好，如果我们把若干（≥1）只同样型号的麦克风固定安装在一个刚性的枝形架子上（可水平移动），组成一个麦克风树，不同的麦克风所处位置的不同，录制到的声音也有细微的不同，进而通过对数个麦克风识取的声音进行对比分析，得到许多有关声源的信息，就可以确定声源的位置。

2 问题的求解

2.1 麦克风树语音信号处理模型概述

将一组不同位置的声学传感器（麦克风），按一定规则或形状，排成一个阵列，采集声音的空间特性叫做麦克风树。

用来采集声音信号，来获取声源的位置信息。按照麦克风树离声源的远近，将模型分类，通常分为进场和远场。

声波由发声体（声源）产生振动，借助空气等各种介质向四面八方传播，是一种纵波。也属于是球面波。

根据麦克风树距声源的不同，将声场模型分为两类：近场和远场。近场模型将声波归类为球面波，因此需要考虑不同阵元间的相位差;而另一种远场模型，则是把声波发出的近似为平面波，相反的是不考虑麦克风不同阵元间接收信号时产生的相位差，而把不同阵元接收信号看成时延关系。因此远场模型可看做被简化的实际模型，这样就可以最大限度的简化处理不同信号的难度，一些语音增强法就是在此基础上产生的。

一般来说远场模型，即麦克风树距声源较远，声源传导至麦克风树各不同阵元件的幅度差较小，可以不做考虑，看做平面波模型;近场模型，即麦克风树距声源的较近，不同阵元间接收信号时产生的幅度差无法忽略，此时看作球面波模型。

远场模式和远场近场通常使用下面这个公式对近场远场进行区别：

r是参考阵元与声源距离，λ为声波波长，L为阵列长度。在现实运用时，式中的r与参考阵元与声源距离r0相比，确定近远场：若r0r，则信号在远场。

2.2 近场模型的实际运用

假设本次模型试验对象处于近场位，和远场位有所不同的是，近场位模型需要考虑到声音发出的位置与每个麦克风之间的相位差，声音发出位置和各个麦克风的距离不再是等距，定位的空间从原来的一维拓展的二维。声音发出位置到每个麦克风的声波幅度减弱也相当重要，不可被忽略。根据声波传播特性可以知道：声波随着传播距离的增高，声波的声压也会随之降低，故声波传播距离与其幅度的变化成反比。

图2引入了任意一个发声源Si（t）和各个麦克风的距离的参数rji，以阵列中心為参照点，Si（t）到参照点的距离为ri其他的参照数与图2一样，只要将rji求出，便可以得到型号传输方向矢量A，因此得出一个结构关系式图1：

近场的均匀线阵接收到的信号可以如图2：

在这条假设中使用的近场均匀线阵模型用时延估计法是无法研究，所以这条近场均匀线阵模型不在继续进行研究。

2.3 求解远场模型

若声源处于远场，则麦克风树成直线排列，且每个麦克风间隔为半个信号波长。通常来讲，语言信号的频率往往在101～3401HZ间，在空气中传播的波长一般都在100～340cm，由此可得，每个麦克风的距离一般在6～15cm之间。

因为远场模型中麦克风收集到的声波为平面波，所以每个麦克风接受到的信号相对相位相同。声源s（θ，r），麦克风接受到的信号与信号的入射角和信号的频率都有关系，因此远场模型还能表示为均匀线阵：

在该式中，ω为角频率，公式中的τji是第i个信号传导第j个麦克风，与第i个信号传导第1个麦克风达的延时参数。τji可表示为：

假设知道在该模型中声音在空气中的传播速度为v，时延TDOA为s，因此l=s*v，根据这些从而求出θ2=arcsin*l/2d，θ1=π/2-θ2。可确定该模型中发声源人的位置，并用广义互相关时延估计算法算出。

该方法的阵列由两个麦克风构成，并接收信号，可列函数为：

2.4 麦克风声源定位的研究与设计

流程设计。本文算法简易，计算量小，应用广泛。广义互相关函数的原理是：首先是求出x1（w）和x2（w）之间的互功率谱函数，通过一些考虑权重的计算，然后经傅里叶反变换法，变换到时域，这样我们就能求出x1（w）和x2（w）的互相关函数，求出极大值，然后两个极大值相减后的绝对值，求出两组信号的时延。

广义互相关时延的估计法相对其他时延估计法简单很多，该方法方法先估计时延，再通过一简单运算就即可确定声源位置。本文的麦克风声源定位是远场定位在二维平面上实现的，只需要把声源与麦克风树的角度求出即可，然而这个角度需要测出两个时延估计值，三维空间要求测出三个时延估计值，这里不做过多讲解。本文研究二维只需要测量两个独立的时间延迟估计值。每个时间延迟估计值对应于一二个方程，把这些方程求出来就可以求出时延估计，所以进行麦克风树声源定位只需要求出时延估计，再进行一些数学计算，就可以确定声源的位置。根据上面的描述，基于时延估的计算法的运算量比较小，在实际应用中很广泛。

3 结论

本文研究的方法“远场定位法”，以及“广义互相关时延估计法”来确定声源的位置。“远场定位法”，只需测出声音信号到达各个麦克风的时延（TDOA），然后完成简单的数学公式推导即可。该方法计算量小，易于实现，实际应用性强。

参考文献：

[1]吴俣.基于麦克风阵列的声源定位技术的研究.百度文库，2008-5-1.

[2]王君培.基于麦克风阵列的进场声源定位与跟踪.百度文库，2014-6.

[3]孙韶杰，孙绍俊，李国辉，李红梅.一种改进的声测定位时延估计算法[J].计算机应用，2006，（11）.

基金项目：内蒙古自治区教育科学“十三五规划课题”数学建模推进高职院校数学课程教学改革的研究NZJGH2019159

作者简介：董晓红（1983—），女，内蒙古包头人，理学硕士，讲师，主要从事高等数学的教学与研究工作。