波束形成算法学习笔记
- Broadside 结构
- Endfire结构
- 两者优缺点
麦克风阵列算法有两大类,一类是波束形成算法,另一类是盲源分离算法,两者互有优劣,先记录波束形成算法的笔记。系列博客先介绍两种常见麦克风阵列结构,然后分别介绍固定波束形成(fixed beamforming, data-independent) 和自适应波束形成(adaptive beamforming, data-dependent)。
本篇博客只介绍Broadside和Endfire两种结构,其优缺点和应用场景。
Broadside 结构
Broadside结构是一种常见的麦克风阵列结构,麦克风之间间距为 d d d,目标语音方向和麦克风之间的连线呈垂直关系,如下图所示。
- Broadside结构的优点是处理简单,只需要将两路麦克风信号相加即可。
- 缺点也很明显,只能衰减两边的信号,对称角度的空间相应是相同的。
- Broadside适合用于有期望信号只来自正前方,干扰来自两侧的场景。
- 两个麦克风的场景,90°和270°的衰减最厉害。
- 在这两个角度衰减成都是分频率的,最大的衰减出现在1/2波长处。对于7.5cm麦克风间距。其最大衰减频率为
343 m / s e c ÷ ( 0.075 m × 2 ) ≈ 2.3 k H z 343 m/sec ÷ (0.075 m × 2) ≈ 2.3 kHz 343m/sec÷(0.075m×2)≈2.3kHz - 高于这个频率后,信号将发生空间混叠,即出现零点。下图中,3kHz的信号出现了四个零点。
- 减小麦克风间距,可以提高发生空间混叠的信号频率,但是会减少低频信号的指向性,即衰减的量不够。
Endfire结构
Endfire是一种常见的麦克风阵列结构,麦克风之间间距为 d d d,目标语音方向和麦克风之间的连线呈平行关系,目标语音先到达一个麦克风再到达另一个,如下图所示。
- Endfire结构的处理会稍微复杂一些,先收到目标语音的麦克风信号于另一路麦克风延迟 z − n z^{-n} z−n后的信号反向相加。
- Endfire的有点是能有足够的衰减。具体的衰减与延迟 z − n z^{-n} z−n相关。
- Endfire适合用于有期望信号只来自端射方向,其他方向都是干扰的场景。
两者优缺点
结构 | 优点 | 缺点 |
---|---|---|
Broadside summing | 1. 实现简单 2. 结构简单 |
1. 非期望方向衰减较少 2. 为防止混叠间距较小 |
Endfire differential | 1. 非期望方向衰减更多 2. 更小的尺寸 |
1.实现复杂,需要延迟 2.低频幅度衰减 3.需要更深的阵列结构 |