基于麦克风阵列的多声源测向方法研究

硕士论文 基于麦克风阵列的多声源测向方法研究

目 录

摘 要 ........................................................................................................... I Abstract ........................................................................................................... II 1 绪论 ............................................................................................................... 1

1.1 课题的研究背景及意义 ......................................................................................... 1 1.2 基于麦克风阵列的声源测向技术简介 ................................................................. 2

1.2.1 麦克风阵列声源测向技术的特点 ............................................................... 2 1.2.2 麦克风阵列声源测向技术的应用领域 ....................................................... 2 1.3 论文的结构安排 ..................................................................................................... 3

2 基于麦克风阵列的声源测向算法 ............................................................... 5

2.1 基于最大输出功率的可控波束形成的方法 ......................................................... 5 2.2 基于高分辨率谱估计技术的方法 ......................................................................... 7 2.3 基于声压幅度比的方法 ......................................................................................... 7 2.4 基于时延估计的方法 ............................................................................................. 9

3双阵元麦克风阵列时延估计方法 .............................................................. 10

3.1 双阵元麦克风阵列信号模型 ............................................................................... 10 3.2 传统的时延估计算法 ........................................................................................... 12

3.2.1 广义互相关函数法(GCC) .......................................................................... 12 3.2.2 最小均方(LMS)自适应滤波 ...................................................................... 16 3.2.3 互功率谱相位法 ......................................................................................... 17 3.3 基于声源信号时频正交特性的时延估计方法(DUET) ...................................... 18

3.3.1 语音信号的加窗分帧处理 ......................................................................... 18 3.3.2 W-Disjoint Orthogonality (WDO)特性........................................................ 20 3.3.3 DUET算法主要流程及仿真结果 .............................................................. 22 3.3.4 DUET算法的局限性 .................................................................................. 25

4基于迭代时频掩蔽的宽间距麦克风阵列相位解卷绕 ............................. 26

4.1 迭代时频掩蔽方法 ............................................................................................... 26 4.2 算法仿真及外场实验结果与分析 ....................................................................... 29

4.2.1宽间距麦克风阵列双声源测向仿真实验结果与分析 .............................. 29 4.2.2宽间距麦克风阵列三声源测向仿真实验结果与分析 .............................. 31 4.2.3外场实测结果与分析 .................................................................................. 33

III

目录 硕士论文

5 基于迭代时频掩蔽的宽间距麦克风实时多声源测向 ............................ 37

5.1 实时多声源测向方法 ........................................................................................... 37

5.1.1 语音端点检测 ............................................................................................. 37 5.1.2 实时多源测向法的具体步骤 ..................................................................... 39 5.2 仿真实验结果与分析 ........................................................................................... 41

6 结论与展望 ................................................................................................. 44

6.1 结论 ....................................................................................................................... 44 6.2 展望 ....................................................................................................................... 44

致 谢 ......................................................................... 错误!未定义书签。 参考文献 ......................................................................................................... 45 附 录 硕士期间论文发表和专利申请情况 ........ 错误!未定义书签。

IV

硕士论文 基于麦克风阵列的多声源测向方法研究

1 绪论

1.1 课题的研究背景及意义

声源测向技术是通过电子和声学装置采集声源信号来探测声源方向的一种技术,它在很多领域都有着广阔的应用前景[1]。根据不同的探测方式,声测技术可以分成主动声测技术和被动声测技术。主动声测技术由发射和接收装置组成,比如根据主动声纳的发射信号的回波来判断目标源的位置。本课题研究的基于麦克风阵列的声源测向技术属于被动测向技术,它只有接收装置。麦克风阵列是指将若干个麦克风按照一定的几何结构组成阵列形式,相较于与单个麦克风有很多的优势。它具有较强的空间选择性,不需要移动麦克风就可以以电子扫描的方式实现目标声源的自动定位跟踪。基于麦克风阵列的多声源测向是指对麦克风阵列采集的多路语音信号进行分析处理,在多个声源的平面内得到各个声源的方位角,它相较于传统的测向系统具有隐蔽性强、可视距远、不受电磁波干扰等优势。

早在20世纪80年代,国外的一些发达国家就已经取得了一定的研究成果。在声测预警方面,以色列研制了一套AEWS声测预警系统,它可以探测慢速飞行的固定翼飞机、直升机、微型飞机等,其实质是一个声学传感器网络,将采集到的信号通过内部的控制中心处理得到的定位数据传送到地面作战指挥所;在直升机探测方面,英国Ferranti公司的 Picker直升机报警器和瑞典Swetron 公司的Helisearch直升机声测系统采用是被动式声探测技术,它是根据接收到的时延值来判断声源方向的[2]。其探测距离能够达到 15-20 km,方位精度可以精确到1度,同时它还有很强的多目标识别、探测的能力;在炮位侦查方面,具有代表性的是瑞典SATT通信公司研制的SORAS-6声测系统和美国工SC技术公司研制的PALS被动声探测系统[3]。这两套系统都由无线电装置,传声器,信号处理计算机和测试子系统组成,它可迅速地测定火炮方位,并且具有很强的抗干扰性。在语音信号处理领域,早在二十世纪八十年代传声器阵列就已经被应用到语音识别、语音增强等系统中。进入二十世纪九十年代以后,它又有了很多其他方面的应用,如大型场所的会议记录、车载环境中的语音获取以及助听装置等[4]。由此可见,声探测技术在很多军用和民用系统中有着相当重要的意义。

目前,国内外已经出现了很多相关的产品,并已广泛地应用到社会各个领域,尤其是近年来无线传感器网络(wireless sensor networks, WSN)在学术研究和工业应用等领域都受到了极大关注,而其中基于传声器阵列的声测节点通过网络融合进行目标感知、定位、跟踪等方面的研究也成为当前研究热点之一,因此开展基于麦克风阵列的多声源测向方法研究有着较为重要的意义。

1

2 基于麦克风阵列的声源测向算法 硕士论文

1.2 基于麦克风阵列的声源测向技术简介

1.2.1 麦克风阵列声源测向技术的特点

麦克风阵列是分布在空间中的、按照一定方式排列的多个麦克风以更好得获取目标的空间信息。它是在传统的阵列信号处理基础上发展起来的,和传统的阵列信号处理的区别在于以下几个方面:

(1)传统阵列信号处理的是有调制载波的窄带信号比如雷达信号。而麦克风阵列处理的是没有经过调制的宽带信号,频率一般集中在30~3000Hz。

(2)传统阵列信号处理的通常是准平稳或者平稳信号,但是麦克风阵列处理的通常是非平稳的语音信号。

(3)传统阵列信号处理一般建立在远场模型的基础上,而麦克风阵列可以根据实际不同的情况选择近场或者远场模型。

麦克风阵列实现被动声源的测向的方法较其他探测方法而言,它具有以下几点优势:

(1)不受视线的限制。由于声波可以绕过障碍物,因此声探测系统可以探测障碍物后的声源位置,突破了激光,无线电等探测方式的局限。

(2)隐蔽性好。基于麦克风阵列的被动声探测系统可以避免电磁波的干扰,工作隐蔽性强,不易被发现。

(3)受外界环境的影响小。声探测系统可以在阴天、雾天等环境下正常使用,受外界环境影响较小。

(4)生产成本低。由于声探测系统的成本相对较低,因此它可以实现大量地布设,以扩大侦测的面积。

1.2.2 麦克风阵列声源测向技术的应用领域

随着对麦克风阵列技术的不断深入研究,基于麦克风阵列的声测系统应用也日益广泛,在国防军事、音/视频会议、人机交互等许多领域方面都有重要的开发潜力与科研价值。

在国防军事领域,声源测向技术最早被应用在飞机、坦克、火炮等目标的探测方面,为了提高准确度,也常结合其他探测方式比如磁场探测、红外探测等。目前国内外又利用该技术为战车和单兵系统配备了便携式的声测系统来帮助士兵监测战场的环境,这些便携系统可以快速准确地检测到炮位、飞机或坦克等方位[5]。

此外在反狙击手方面声测向技术也得到了很好应用。在城市巷战中,只有准确、快速地发现并消灭狙击手,才能保障进攻方的行动安全。反狙击手声测定位仪通过接收并测量膛口激波和弹丸飞行产生的冲击波来确定狙击手的位置,常见的有固定设置

2

联系客服:779662525#qq.com(#替换为@)