1、第 41 卷第 6 期2022 年 12 月Vol.41,No.6Dec.,2022声学技术Technical Acoustics基于Gammatone滤波器组与子带瞬时频率的水声目标特征提取连梓旭,孙向前(91388部队44分队,广东湛江 524000)摘要:水声目标识别是现代海战中的关键环节,具有重要的军事应用价值。针对海洋环境的复杂性及多变性,文章以模仿人耳听觉感知机理为基础,提出了基于伽玛通(Gammatone)频率瞬时幅频系数的特征提取方法。该方法通过Gammatone滤波器组模拟人耳基底膜对信号的分解、处理过程,在各子带输出信号中提取目标的子带瞬时频率特征,并与传统的瞬时幅度特征相
2、结合,从而更加全面地反映目标的固有属性。利用支持向量机对四类实测水声目标辐射噪声数据进行了识别实验,结果表明,文章的特征提取算法能够较好地抑制噪声,具有较强的鲁棒性。关键词:伽玛通(Gammatone)滤波器组;子带瞬时频率;特征提取;水声目标识别中图分类号:TN911.7 文献标志码:A 文章编号:1000-3630(2022)-06-0827-06Feature extraction of underwater acoustic target based on Gammatone filter-bank and subband instantaneous frequencyLIAN Zix
3、u,SUN Xiangqian(Unit 94,No.91388 Troops of PLA,Zhanjiang524000,Guangdong,China)Abstract:Underwater acoustic target recognition is the key part in modern naval battle and has important military application value.In this paper,by considering the complexity and variability of underwater environment,a f
4、eature extraction method imitating the mechanism of human auditory perception is presented based on Gammatone frequency instantaneous amplitude and frequency coefficients.The Gammatone filter-bank is used to simulate the process of signal decomposition and processing of ear basement membrane,and the
5、 subband instantaneous frequency features of the target extracted from the outputs of Gammatone filter-bank are concatenated with the traditional instantaneous amplitude features to fully reflect the inherent nature of the target.The results of recognition experiments on the measured target data sho
6、w that the proposed feature extraction method can suppress noise and has good robustness.Key words:Gammatone filter-bank;subband instantaneous frequency;feature extraction;underwater acoustic target recognition0引 言水声目标识别是现代海战中的关键技术之一,是水声设备与武器系统智能化的重要标志,具有重要的军事应用价值。在水声目标识别领域,特征提取始终是一个重要的研究课题。然而,海洋环境的
7、复杂性及多变性严重影响水声目标特征提取方法的稳定性,直接导致识别系统性能下降。因此,如何选取鲁棒性好的特征提取方法一直是水声目标识别领域的重要研究内容之一。水声目标辐射噪声的发声机理复杂,其成分主要包含宽带连续谱分量、窄带线谱分量,并且存在明显的幅度调制。其中,宽带连续谱主要由水动力噪声及螺旋桨空化噪声引起,窄带线谱主要由机械噪声引起1。传统的特征提取方法通常是基于谱分析或时频分析理论,但是在实际应用中并未取得令人满意的识别效果。近年来,尽管机器识别取得了巨大的进步,但在大多数情况下,声呐兵的听觉识别效果仍然优于系统的识别效果2。因此,从模拟声呐兵的听觉感知机理出发,研究适用于水声目标的听觉特
8、征提取方法日益受到重视。引用格式:连梓旭,孙向前.基于Gammatone滤波器组与子带瞬时频率的水声目标特征提取J.声学技术,2022,41(6):827-832.LIAN Zixu,SUN Xiangqian.Feature extraction of underwater acoustic target based on Gammatone filter-bank and subband instantaneous frequen-cyJ.Technical Acoustics,2022,41(6):827-832.DOI:10.16300/ki.1000-3630.2022.06.006
9、收稿日期:2021-07-27;修回日期:2021-09-01作者简介:连梓旭(1992),男,黑龙江齐齐哈尔人,硕士,研究方向为水声信号处理。通信作者:连梓旭,E-mail:2022 年声学技术随着听觉心理和生理学的不断发展,听觉特征提取方法取得了巨大的进步,并被广泛应用于语音信号处理中,也有不少学者将其应用于水声目标识别领域。李秀坤等采用伽玛通(Gammatone)滤波器组作为人耳听觉模型并提取水声目标的听觉感知特征2。张揽月等采用美尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)作为水声目标辐射噪声的特征,证实了听觉特征在水声目标识别中应
10、用的可行性3。马元峰等利用模拟人耳功能的串行压缩伽玛频率滑动(Cascade Compressive Gammachirp,CcGC)滤波器组提取水声目标的听觉谱特征,并分析了听觉特征抑制噪声的机理4。牟林等集成Gammatone听觉滤波器与Meddis模型来模拟耳蜗处理机制,从而提取水声目标的调制谱特征5。吴姚振等结合Gammatone滤波器组与离散小波变换,提取了有效吻合人耳特性的水声目标鲁棒特征6。上述的听觉特征提取方法虽然取得了较好的分类识别效果,但均侧重于水声目标辐射噪声信号的幅度特征,并未深入研究其相位特征。然而,信号的瞬时相位也能反映出目标的部分特性,并且是承载相位信息的主要参数
11、。因此,通过提取水声目标辐射噪声信号的瞬时频率特征,并与幅度特征相结合,能够有效改善水声目标识别系统的性能。本文在已有研究的基础上,基于Gammatone滤波器组与子带瞬时频率,提出Gammatone频率瞬时幅频系数(Gammatone Frequency Instantaneous Amplitude and Frequency Coefficients,GFIAFC)的水声目标特征提取方法。该方法采用Gammatone滤波器组模拟人耳基底膜对信号的频率分解特性,在各子带输出信号中提取目标子带瞬时频率特征,并与传统的瞬时幅度特征相结合,从而更加准确地反映水声目标的固有属性。最后,采用支持向量
12、机(Support Vector Machine,SVM)对四类实测水声目标辐射噪声数据进行分类识别。实验结果表明,该方法在一定信噪比条件下能够有效提升水声目标识别的准确率,具有较强的鲁棒性。1Gammatone滤波器组在人耳的听觉感知系统中,基底膜是进行声信号处理的关键部分。研究表明,基底膜对声信号具有频率分解功能,不同频率的声音会激起基底膜不同部位的振动。从信号处理的角度,可将基底膜的这种频率响应特性抽象为一组带通滤波器,从而模拟基底膜对声信号的频率分解过程。本文用Gammatone 滤波器组来模拟基底膜的频率分解特性。Gammatone滤波器具有简单的时域冲激响应,并且只需要很少的参数就
13、能够较好地模拟基底膜的频率分解功能。Gammatone函数的时域表达式g(t)为g(t)=atn-1exp-2bERB(fc)t cos(2fct+)u(t)(1)式中:u(t)为单位阶跃函数;a为滤波器增益;b为与滤波器带宽有关的参数,通常取1.019;n为滤波器的阶数,研究表明,n=4时Gammatone滤波器就能较好地模拟基底膜的特性7;fc为滤波器的中心频率;为相位,通常设为0;ERB(fc)表示等效矩形带宽(Equivalent Rectangular Bandwidth,ERB),它决定了滤波器的带宽,并且与人耳听觉临界频带有关8。滤波器的ERB与中心频率fc之间的关系可表示为ER
14、B(fc)=24.7+0.108fc(2)Gammatone滤波器组中各滤波器的带宽由式(2)决定,并且每个滤波器的带宽均不同。图1给出了中心频率为1 000 Hz的四阶Gammatone滤波器的时域波形及幅频响应。考虑到计算的复杂性以及水声目标辐射噪声的频率分布范围,本文采用24个滤波器组成24通道的Gammatone滤波器组来模拟人耳基底膜的频率分解功能,其中心频率按照ERB域的转换关系,在505 000 Hz之间均匀分布。频率域与ERB域的转换关系为E=21.4lg(4.37f/1000+1)(3)式中:E为f在ERB域上对应的频率值。各滤波器的中心频率确定后,便可由式(2)计算出各滤波
15、器的ERB9。表1给出了24通道Gammatone滤波器组的中心频率分布情况。图2给出了24通道Gammatone滤波器组的幅频响应。在实际应用中,需要对Gammatone滤波器的时域冲激响应进行离散化处理后才能在计算机中实现。本文采用Slaney提出的方法来实现Gammatone滤波器9。在式(1)中,令w0=2fc,B=2bERB(fc),忽略相位和滤波器增益a,可将式(1)简化为图1四阶Gammatone滤波器组中1 000 Hz中心频率的滤波器时域波形和幅频响应曲线Fig.1Time-domain waveform and amplitude-frequency re-sponse c
16、urves of the filter with a center frequency of 1 000 Hz in the fourth Gammatone filter-bank828第 6 期连梓旭等:基于Gammatone滤波器组与子带瞬时频率的水声目标特征提取g(t)=tn-1exp(-Bt)cos(w0t)u(t)(4)对上式进行拉普拉斯变换,可得Gammatone 函数在s域的传递函数:G(s)=(n-1)!2(s-iw0+B)-n+(s+iw0+B)-n(5)根据s域到z域的映射关系z=esT,并定义a1=cos(w0T),a2=sin(w0T),a3=e-BT,采用冲激响应不变法,可得到4阶Gammatone滤波器在z域上的传递函数:G(z)=T-Ta3a1+(2+1)a2z-11-2a1a3z-1+a23z-2T-Ta3a1-(2+1)a2z-11-2a1a3z-1+a23z-2T-Ta3a1+(2-1)a2z-11-2a1a3z-1+a23z-2T-Ta3a1-(2-1)a2z-11-2a1a3z-1+a23z-2=G1(z)G2(z)G3(z)G4(z)(6)由