收藏 分享(赏)

WM8978音频处理器的百度AI语音识别_牛帅.pdf

上传人:哎呦****中 文档编号:304811 上传时间:2023-03-20 格式:PDF 页数:3 大小:426.28KB
下载 相关 举报
WM8978音频处理器的百度AI语音识别_牛帅.pdf_第1页
第1页 / 共3页
WM8978音频处理器的百度AI语音识别_牛帅.pdf_第2页
第2页 / 共3页
WM8978音频处理器的百度AI语音识别_牛帅.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、 年第期 音频处理器的百度 语音识别牛帅,张弛,董振华,何义(金陵科技学院 电子信息工程学院,南京 ;金陵科技学院 智能科学与控制工程学院)摘要:近几年,随着国内 技术的迅猛发展,语音识别技术已经成为最热门的应用领域之一,广泛应用于金融、教育、医疗、车载、机器人等领域。因此本设计在 单片机上通过 实现了百度 语音识别。通过 音频处理器采集上传服务器解析数据,将语音结果显示在 屏上。关键词:语音识别;百度 ;音频处理器中图分类号:文献标识码:,(,;,):,:;引言随着信息技术产业的发展,嵌入式系统利用自身的技术特点获得了越来越广泛的应用,语音识别就是其中的热门话题。语音识别技术就是让机器将语音

2、信号转变为相应的文本或命令的技术,也就是让机器听懂人类的语音。相对于传统的控制、交互形式,在智能家居领域使用语音交互对于用户来说更加便捷。语音识别作为所有智能家居交互的入口,扮演着一个非常重要的角色。除了常规的日程设置、音乐播放、天气等信息查询外,智能音箱还可以控制灯光、空调、电视、窗帘、门窗、安防与监控等。语音识别不仅在翻译机、录音笔、语音输入法等强依赖于语音识别技术本身准确率的产品中发挥巨大作用,而且在办公、教育、旅游等领域的应用也越来越广泛。有很多学者研究了语音识别的相关应用。魏子瑄等设计了 一 款 基 于 语 音 识 别 的 智 能 分 类 垃 圾 桶,使 用 芯片进行语音识别,但只能

3、识别有限的固定关键词语,应用范围较窄;谭磊等使用 神经网络设计了一款基于嵌入式的语音识别系统,能够识别非特定人的语音,但其操作复杂,对嵌入式平台的要求较高;杜凡等基于最优词序列实现了更高的解码词图精度,有效提高了调度语音识别的准确率。总体方案本文设 计 的 基 于 百 度 的 语 音 识 别 系 统 以 带 有 微处理器的开发板为核心,开发板自带一个全功能 音频处理器。通过 的录音功能录制 采样率的音频,并存入 卡中;使用 连接百度 语音识别服务器,将 卡中录制的音频文件分批透传发送至服务器,通过串口接收得到返回的识别结果,利用自制的 解析库得到其识别的中文结果。系统整体流程框图如图所示。图系

4、统整体流程框图敬请登录网站在线投稿()年第期 软硬件技术 开发板本项目以 微处理器的开发板为核心,此开发板拥有 、等丰富的外设接口,主频高达 ,符合本设计要求。音频处理器 音频处理器使用接口与开发板通信,支持处理最高 、位的音频,采用 、标准,接口类型为两线或三线。其 级数字信号处理内核支持增强 硬件环绕音效和频段的硬件均衡器,板载麦克风的支持提供高质量录音的效果,满足本设计的技术需要。模块本设计采用 作为 模块,负责联网和透传音频数据到云端服务器。模块是乐鑫发布的一款集蓝牙与 于一体的开发板,工作中以 作为主机,模组作为从机,通过内置的 指令控制 、等操作,使用便捷,响应速度快。音频文件百度

5、 语音识别平台支持 、四种音频格式,是一种无损的音频文件格式,使用范围广,因此本项目使用 格式录制音频文件。是 文件的拓展名,最基本的 文件是由没有经过任何压缩的 文件压缩而来的,是计算机领域最常用的数字化声音文件格式之一,文件在播放时需要先解压缩成 格式,才能通过音频芯片播放。文件 是 以 格 式 来 组 织 内 部 结 构 的。文件结构可以看作是树状结构,其基本构成是称为“块()”的单元,最顶端是一个“”块,下面的每个块由类型块标识符、数据大小及数据等项组成,块的结构如表所列。表 块结构名称大小备注块标识符 个小写字符(如 )数据大小 类型,表示后接数据的大小()数据本块中正式的音频数据

6、百度语音识别 语音数据上传有两种方式,一种是 格式 上传本地音频文件,另一种是 格式 上传本地音频文件。鉴于嵌入式平台内存有限,本项目采用 方式上传数据,免去了 编码,可以直接上传音频文件二进制数据,节省了内存空间。由于音频文件数据量太大,本项目采用分批串口透传数据的方式将音频文件上传至云平台。使用自制 解析库得出语音识别结果。打开百度 平台控制台,进入应用列表,创建应用,新建一个百度语音识别 应用,获取 和 ,界面如图所示。图创建 应用 测试结果 识别结果本设计语音识别界面如图所示。图百度 语音识别界面 请求测试在将百度语音识别 移植到 嵌入式平台前,需要使用 调试工具进行 请求调试。本文

7、年第期 使用 工具进行 请求,获得 并利用此 进行语音识别测试,测试界面如图所示。图 语音识别测试 识别准确率测试不同噪声环境测试在其他条件相同的情况下,在不同噪声环境下进行识别准确率的测试,结果如图所示,符合预期。由此可见,本设计的最佳应用场所噪声应在 范围内。图不同噪声下的识别准确率不同音调测试为了实现不同音调的语音识别测试,本项目以性别为分水岭进行男声和女声两组测试,测试结果如图所示。由测试结果可以看出,不同音调对百度 语音识别的影响较小,波动较为稳定。图不同音调测试不同采样率测试百度 语音识别平台支持 和 采样率的音频,采样率直接决定了声音的音质。因此,本项目针对不同采样率进行识别准确

8、率的测试,测试结果如图所示。图不同采样率测试 结语本文在 单片机上结合 实现了百度 语音识别,基本达到了设计预期,但仍存在不足之处,音频数据通过串口发送至 模块,再透传到百度 服务器,因此上传速率会受到串口发送速率的限制,波特率为 时速率为 。参考文献 中刘衡祁研究了 芯片的 外部拓展接口,并通过仿真测试得出 接口可正常运行在 芯片上,最高传输速率可达 ,大大提高了数据传输速率,本设计可改进使用 协议来获得更好的识别效果。参考文献余亚东,李春江,杨丽 基于语音识别的智能家居物联网系统计算机应用,():牛可,张珣智能家居语音识别通用语音 云平台的设计与实现物联网技术,():,许秀富,吕小南 手机

9、的智能家居语音控制系统设计 单片机与嵌入式系统应用,():,魏子瑄,刘小刚,陈真贵,等基于语音识别技术的智能分类垃圾桶 单片机与嵌入式系统应用,():谭磊,余欣洋,罗伟洋,等基于深度学习的移动端语音识别系统设计单片机与嵌入式系统应用,():,杜凡,张敏,单祖植,等基于语言模型的调度语音智能识别研究单片机与嵌入式系统应用,():龚俊怡,朱蕴璞,宋成桥 嵌入式无线音频采集系统设计国外电子测量技术,():黄玉金,杨越,薛伟,等 无线模块的 指令 透传设计 电子产品世界,():,王波 单片机的高音质 播放器设计 单片机与嵌入式系统应用,():刘衡祁 芯片的高速 接口设计与验证无线互联科技,():,通信作者:董振华,。(责任编辑:薛士然收稿日期:)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2