收藏 分享(赏)

基于共振峰和梅尔倒谱的声纹特征提取SOC设计_席青云.pdf

上传人:哎呦****中 文档编号:2564677 上传时间:2023-07-12 格式:PDF 页数:6 大小:1.92MB
下载 相关 举报
基于共振峰和梅尔倒谱的声纹特征提取SOC设计_席青云.pdf_第1页
第1页 / 共6页
基于共振峰和梅尔倒谱的声纹特征提取SOC设计_席青云.pdf_第2页
第2页 / 共6页
基于共振峰和梅尔倒谱的声纹特征提取SOC设计_席青云.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷 第 期 年 月传 感 技 术 学 报 .项目来源:黑龙江省自然科学基金();黑龙江省高等教育教学改革项目();黑龙江省教育厅基本业务专项项目()收稿日期:修改日期:,(,;,):,(),()(),():;:基于共振峰和梅尔倒谱的声纹特征提取 设计席青云,邱长江,陶佰睿,关新宇,苗凤娟(内蒙古广播电视大学兴安盟分校,内蒙古 兴安盟乌兰浩特;齐齐哈尔大学通信与电子工程学院,黑龙江 齐齐哈尔)摘 要:反映声道(谐振器)物理特性且不易受环境影响的元音共振峰可以更好地反映说话人的声纹特征,为此提出了说话人共振峰自适应(梅尔倒谱系数)特征提取(片上系统)设计。首先提取说话人语音元音的三组共振峰来设

2、计 三角形滤波器组,并基于传统 与共振峰改进 矩阵参数比值设计自适应融合说话人语音特征以改进。在 中完成性能仿真,在 中完成 代码设计,在(现场可编程门阵列)开发板上完成 设计、编译、仿真和验证下载。结果表明,在较高信噪比环境下,基于自适应融合和共振峰改进的 得到的特征向量比传统的 具有更强的鲁棒性,此技术在说话人声纹身份识别传感器设计中有较大应用推广价值。关键词:声纹识别;共振峰;梅尔频率;自适应融合;片上系统中图分类号:文献标识码:文章编号:()互联网技术已广泛应用于生产和人们的日常生活中,其安全问题一直备受关注。近年来,语音识别以其易于接收、获取方便、准确率高等优点越来越受到人们的欢迎。

3、此外,特征提取部分是语音识别系统中最重要的部分。在其他文献中,共振峰和 的组合是通过连接相应的特征向量来实现的,然而,简单的连接可能会导致高维特征包含来自不同输入特征流的冗余信息。与 相比,共振峰不太容易受到噪声的影响。此外,元音共振峰在语音识别中起着重要作用。汉语有五个主要元音,即 ,。五个汉语元音的识别对汉语语音识别非常有用。共振峰频率因性别、年龄、民族和地域等而不同。在、和 中发现了元音和性别之间的显著交互作用。倒谱分析已被证明是一种有效的工具,频率倒谱系数()可被视为元音特第 期席青云,邱长江等:基于共振峰和梅尔倒谱的声纹特征提取 设计 征的有利选择。在本文中,我们提出了一种基于共振峰

4、的改进 滤波器组的新方法。首先,使用 软件提取三组共振峰、和。其次,在 上从语音信号中提取传统 参数矩阵和基于改进 的共振峰参数矩阵。当共振峰差异不大时,选择传统的,当两共振峰差异较大,使用基于 和 的修正,其他情况下使用基于 和 的修正。因此,我们计算了传统 和改进 的 比值,以进行自适应融合。最后,系统是通过 平台 核设计,并完成编译、模拟和下载验证。测试方法 基于人耳临界带宽随频率的已知变化。该技术基于两种类型的滤波器,即线性间隔滤波器和对数间隔滤波器。通过在 频率标度上表示信号,可以捕捉语音的重要语音特征。共振峰不太容易受到环境变化的影响,并且共振峰对人类语音识别率有显著影响。因此,我

5、们使用说话人的共振峰和 倒谱系数()从语音信号中识别说话人。该过程包括以下步骤:预加重用于强调高频。采用成帧将信号分成小帧。应用了窗口化以平滑框架的侧面。利用 进行时域到频域的变换。滤波器组由共振峰、和 改进,共振峰和 的组合不是通过简单地连接相应的特征向量来实现的,它不能通过基于共振峰频率修改 滤波器组来产生高维特征。采用 将 谱转换回时域。利用融合技术将传统的 和基于共振峰的改进 结合起来。基于多算法融合的说话人语音特征提取流程如图 所示。图 特征提取流程图 共振峰提取论文涉及研究对象为男性 名,女性 名,年龄在 岁之间,平均年龄、身高和体重分别为 岁、和 。他们被要求发 个持续时间为 的

6、汉语元音。语音信号是用连接到台式电脑的麦克风录制。语音采样频率为,分辨率为 位。所有的录音都是在正常的室内环境下进行的。软件被用来确定元音的前三个共振峰频率。以说话人 和说话人 为例,说话人 和 在元音 中的共振峰提取分别如图 和图 所示。图 说话人 在元音 中的共振峰图 说话人 在元音 中的共振峰五个元音中的前三个共振峰频率显示在表 和表 中,分别对应说话人 和说话人。并且还计算了五个元音中三个共振峰频率的平均值。我们可以看到,即使说同一个元音,不同说话人的共振峰也不相同。表 五个元音中说话人 的共振峰元音 平均值 传 感 技 术 学 报第 卷表 五个元音中说话人 的共振峰元音 平均值 滤波

7、器组的改进设计图 显示了基于共振峰、和 的改进 滤波器组的设计。利用 频率倒谱特征缩放的三角滤波器集进行滤波。每个三角形都可以用作带通滤波器,具有中心频率和上、下截止频率。中心频率是人耳在某一频率范围内的感知中心,上下频率是人耳在该频率范围内的感知范围。滤波器的形状可以是三角形窗、汉明窗或汉宁窗。本文选用常用的三角形滤波器,尺度上的最大值由 频率与线性频率的关系决定,如公式()所示,滤波器组的区间为 与 或 与 的差值。图 为 滤波器组的改进设计。()()图 滤波器组设计过程由表 和表 中 和 说话人 滤波器组参数可知,相比 和 差的情况,说话人 和 的差值要大于 说话人对应的差值。说话人 和

8、说话人 的三角形滤波器的数量在 尺度上的最大值为 时是不一样的。基于说话人 的 和 的 滤波器的数量比说话人 多一个。基于 和 的 滤波器的数量正好相反。表 基于 和 的 滤波器组参数每个三角形滤波器的间隔三角形滤波器的数量说话人 说话人 表 基于 和 的 滤波器组参数每个三角形滤波器间隔三角形滤波器数量说话人 说话人 除了采样频率、的最低频率、最高频率和长度,不同的共振峰对三角滤波器的振幅也有影响。如图()和图()中说话人 的 滤波器组,图()中 和 的差值小于图()中 和 的差值,而幅值数量则与上述描述相反。作为参考,说话人 的 滤波器组如图()和图()所示。图 说话人 和 和 差值及 和

9、 差值的三角滤波器幅值图 说话人 和 差值以及 和 差值的三角滤波器波形三角形滤波器的波形主要由滤波器的间隔决定。图()和图()所示为说话人 的 滤波器组,每个滤波器的带宽就是图()中 和 的第 期席青云,邱长江等:基于共振峰和梅尔倒谱的声纹特征提取 设计 差值,图()中 和 的差值,可以看出 和 的差值要大得多。作为对比,图()和图()分别为说话人 的 滤波器组。特征提取 传统 的提取对比图 说话人语音信号特征提取流程,传统 对说话人语音信号特征提取主要流程是:预强调,加窗和,滤波器组取对数,得到对数 谱图。加窗窗口长度和移位分别为 和。传统 说话人()、()的语音特征提取如图 所示。图 基

10、于传统 说话人()()之间的比较 改进 的提取与 部分节不同的是,采用了基于共振峰的改进的 滤波器组。共振峰频率直接从时域信号中提取。在图 中,我们展示了本文中使用的不同特征集,图()、图()、图()和图()中 组件的维数为。图 修改后的 显示说话人 与 的比较,和 差异以及 和 差异的比较 适应性特征融合 比值分析用于从传统 和基于共振峰的改进 中选择显著特征。从 比值的最高值中选择显著特征。图 显示了两种改进的 和传统 的尺寸和 比值的关系。我们可以看到,每个系数有不同程度的重要性,的重要性基于 和 更大的前三个组件,在最后六个组件中 基于 和 占据了一个重要的位置。图 基于共振峰的传统

11、和改良 的 比值 系统设计 组件设计 将处理器、外围设备、存储器、定制知识产权组件集成在单个芯片上。基于 的 为用户开发复杂系统提供了硬件重用、更容易的可编程性。所提出的 系统使用 ,由 处理器、定时器等外设、中断模块和、滤波器组等 核组成。图 显示了在 构建器上的自 定 义 核。图 在 构建器上的自定义 核 仿真结果系统设计采用 系列 作为主控芯片。反应时间可达纳秒级,保证系统测量的准确性。对、采样频率、语音信号等测试台代码进行编码,验证设计的正确性。仿真结果如图 所示。传 感 技 术 学 报第 卷图 时序仿真 编译下载编译报告如图 所示,总结了 板上元器件的资源利用率。例如,引脚利用率为总

12、数的。编译成功后将数据下载到 开发版上。图 编译占用资源 实验结果将标准差的计算应用于传统 和改进 及融合 的特征向量。不同算法的性能结果如表 所示,对应的图如图 所示。我们可以看到,传统 的标准差值最大,融合 的标准差最小,基于 和 的修改后 的标准差值小于基于 和 的修改后 的标准差值。标准差值越小,系统的鲁棒性就越强。当信噪比为 时,融合 的效果远远好于传统。显然,基于共振峰的融合 和改进的 对噪声的鲁棒性更强。表 不同信噪比条件下特征向量的均值和标准差信噪比传统标准差改进 基于 和 的标准差基于 和 的标准差融合标准差图 不同算法的 结语本研究中提出了基于共振峰、和 改进的基于 的语音

13、特征提取 系统。提取元音信号的 作为元音的特征,对传统、基于共振峰改进 和融合 算法进行对比分析,然后实现了 设计。实验表明,融合的 及改进的 可以达到更强的鲁棒性,并且优于传统的。参考文献:,():李婉玲,张秋菊 基于 的抗噪语音特征提取及优化 传感器与微系统,():,:唐忠林,杨建华,雷宏伟 语音交互与力感知式智能牙周探针开发 传感技术学报,():,():,:,():,:,:,第 期席青云,邱长江等:基于共振峰和梅尔倒谱的声纹特征提取 设计 ,():,():王学光,诸珺文,张爱新 基于 特征的声纹同一性鉴定方法 计算机科学,():,():朱亚涛,陈霏,张雨晨,等 基于循环神经网络的双耳助听器语音增强算法 传感技术学报,():张成晖,叶朝辉,张立伟,等 在声波测井数据采集系统中的应用 传感器与微系统,():龚泯宇,郭世旭,田皓文,等 基于 的低噪声高保真数字水听器设计 传感技术学报,():席青云(),女,蒙古族,内蒙古兴安盟人,硕士,副教授。研究方向人工智能与大数据处理,;邱长江(),男,汉族,江苏宿迁人,在读硕士研究生。研究方向为跳频信号检测,;陶佰睿(),男,汉族,吉林洮南人,博士,教授,研究方向为 设计和微纳传感器,。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2