硕士论文 基于麦克风阵列的多声源测向方法研究
图5.4 (a)表述了三个声源各自的短时能量图,图5.4(b)采用的是传统的DUET算法,显然在时延参数轴零值附近存在的模糊值,影响了声源真实方位的判断,图5.3 (c)采用了迭代时频掩蔽法进行处理,此时只有在预期的时延值(10,-5,5)附近有声源的方位信息。通过对比分析可以知道本章节提出的实时测向法在改善相位模糊问题的同时,也提高了算法的实时性,在每一个短帧时刻均给出当前的声源方位信息,这给今后的动态声源跟踪研究打下了良好的基础。
43
6 结论与展望 硕士论文
6 结论与展望
6.1 结论
本文研究的是基于麦克风阵列的多声源测向问题。声源测向中最关键的技术就是时延估计。传统的时延估计算法有如广义互相关法,最小均方自适应滤波法,互功率谱相位法等,然而这些方法通常在多源情况下均会失效。本文重点研究的是基于语音信号时频正交特性的时延估计算法,其中以退化分离估计技术(DUET)为代表,可以仅用两个麦克风实现多声源测向。该类算法实现简单,计算量小,然而也存在一定的局限性,即当麦克风间距加大时,在高频部分会出现相位卷绕问题,严重影响多声源测向结果的准确性。针对该问题,本文提出了一种基于迭代法时频掩蔽的宽间距麦克风阵列相位解卷绕方法,明显改善了在宽间距麦克风阵列中出现的相位卷绕引起的模糊问题,并给出了基于上述思路用于实时处理场合的多声源实时测向算法实现步骤。同时也做了较多的模拟仿真和实际环境下的外场实验验证了本文所述算法的有效性。
6.2 展望
在实际的应用中,环境的复杂性是不可避免的,如果在低信噪比环境下或者声源间能量强度差距较大时如何测出多个目标的方位这仍是我们需要解决的问题。其次本文考虑的是相对理想的环境,外场无遮蔽,无多径,声源本身是静止的,如果环境变更复杂时就需要我们进一步研究和讨论。因此,如何提高实际环境中的算法性能是我们将来需要进一步深入研究的问题。
44