WM8978音频处理器的百度AI语音识别_牛帅.pdf-资源下载-蜗牛文库-知识共享服务平台

WM8978音频处理器的百度AI语音识别_牛帅.pdf

1、年第期音频处理器的百度语音识别牛帅，张弛，董振华，何义（金陵科技学院电子信息工程学院，南京；金陵科技学院智能科学与控制工程学院）摘要：近几年，随着国内技术的迅猛发展，语音识别技术已经成为最热门的应用领域之一，广泛应用于金融、教育、医疗、车载、机器人等领域。因此本设计在单片机上通过实现了百度语音识别。通过音频处理器采集上传服务器解析数据，将语音结果显示在屏上。关键词：语音识别；百度；音频处理器中图分类号：文献标识码：，（，；，）：，：；引言随着信息技术产业的发展，嵌入式系统利用自身的技术特点获得了越来越广泛的应用，语音识别就是其中的热门话题。语音识别技术就是让机器将语音

2、信号转变为相应的文本或命令的技术，也就是让机器听懂人类的语音。相对于传统的控制、交互形式，在智能家居领域使用语音交互对于用户来说更加便捷。语音识别作为所有智能家居交互的入口，扮演着一个非常重要的角色。除了常规的日程设置、音乐播放、天气等信息查询外，智能音箱还可以控制灯光、空调、电视、窗帘、门窗、安防与监控等。语音识别不仅在翻译机、录音笔、语音输入法等强依赖于语音识别技术本身准确率的产品中发挥巨大作用，而且在办公、教育、旅游等领域的应用也越来越广泛。有很多学者研究了语音识别的相关应用。魏子瑄等设计了一款基于语音识别的智能分类垃圾桶，使用芯片进行语音识别，但只能

3、识别有限的固定关键词语，应用范围较窄；谭磊等使用神经网络设计了一款基于嵌入式的语音识别系统，能够识别非特定人的语音，但其操作复杂，对嵌入式平台的要求较高；杜凡等基于最优词序列实现了更高的解码词图精度，有效提高了调度语音识别的准确率。总体方案本文设计的基于百度的语音识别系统以带有微处理器的开发板为核心，开发板自带一个全功能音频处理器。通过的录音功能录制采样率的音频，并存入卡中；使用连接百度语音识别服务器，将卡中录制的音频文件分批透传发送至服务器，通过串口接收得到返回的识别结果，利用自制的解析库得到其识别的中文结果。系统整体流程框图如图所示。图系

4、统整体流程框图敬请登录网站在线投稿（）年第期软硬件技术开发板本项目以微处理器的开发板为核心，此开发板拥有、等丰富的外设接口，主频高达，符合本设计要求。音频处理器音频处理器使用接口与开发板通信，支持处理最高、位的音频，采用、标准，接口类型为两线或三线。其级数字信号处理内核支持增强硬件环绕音效和频段的硬件均衡器，板载麦克风的支持提供高质量录音的效果，满足本设计的技术需要。模块本设计采用作为模块，负责联网和透传音频数据到云端服务器。模块是乐鑫发布的一款集蓝牙与于一体的开发板，工作中以作为主机，模组作为从机，通过内置的指令控制、等操作，使用便捷，响应速度快。音频文件百度

5、语音识别平台支持、四种音频格式，是一种无损的音频文件格式，使用范围广，因此本项目使用格式录制音频文件。是文件的拓展名，最基本的文件是由没有经过任何压缩的文件压缩而来的，是计算机领域最常用的数字化声音文件格式之一，文件在播放时需要先解压缩成格式，才能通过音频芯片播放。文件是以格式来组织内部结构的。文件结构可以看作是树状结构，其基本构成是称为“块（）”的单元，最顶端是一个“”块，下面的每个块由类型块标识符、数据大小及数据等项组成，块的结构如表所列。表块结构名称大小备注块标识符个小写字符（如）数据大小类型，表示后接数据的大小（）数据本块中正式的音频数据

6、百度语音识别语音数据上传有两种方式，一种是格式上传本地音频文件，另一种是格式上传本地音频文件。鉴于嵌入式平台内存有限，本项目采用方式上传数据，免去了编码，可以直接上传音频文件二进制数据，节省了内存空间。由于音频文件数据量太大，本项目采用分批串口透传数据的方式将音频文件上传至云平台。使用自制解析库得出语音识别结果。打开百度平台控制台，进入应用列表，创建应用，新建一个百度语音识别应用，获取和，界面如图所示。图创建应用测试结果识别结果本设计语音识别界面如图所示。图百度语音识别界面请求测试在将百度语音识别移植到嵌入式平台前，需要使用调试工具进行请求调试。本文

7、年第期使用工具进行请求，获得并利用此进行语音识别测试，测试界面如图所示。图语音识别测试识别准确率测试不同噪声环境测试在其他条件相同的情况下，在不同噪声环境下进行识别准确率的测试，结果如图所示，符合预期。由此可见，本设计的最佳应用场所噪声应在范围内。图不同噪声下的识别准确率不同音调测试为了实现不同音调的语音识别测试，本项目以性别为分水岭进行男声和女声两组测试，测试结果如图所示。由测试结果可以看出，不同音调对百度语音识别的影响较小，波动较为稳定。图不同音调测试不同采样率测试百度语音识别平台支持和采样率的音频，采样率直接决定了声音的音质。因此，本项目针对不同采样率进行识别准确

8、率的测试，测试结果如图所示。图不同采样率测试结语本文在单片机上结合实现了百度语音识别，基本达到了设计预期，但仍存在不足之处，音频数据通过串口发送至模块，再透传到百度服务器，因此上传速率会受到串口发送速率的限制，波特率为时速率为。参考文献中刘衡祁研究了芯片的外部拓展接口，并通过仿真测试得出接口可正常运行在芯片上，最高传输速率可达，大大提高了数据传输速率，本设计可改进使用协议来获得更好的识别效果。参考文献余亚东，李春江，杨丽基于语音识别的智能家居物联网系统计算机应用，（）：牛可，张珣智能家居语音识别通用语音云平台的设计与实现物联网技术，（）：，许秀富，吕小南手机

9、的智能家居语音控制系统设计单片机与嵌入式系统应用，（）：，魏子瑄，刘小刚，陈真贵，等基于语音识别技术的智能分类垃圾桶单片机与嵌入式系统应用，（）：谭磊，余欣洋，罗伟洋，等基于深度学习的移动端语音识别系统设计单片机与嵌入式系统应用，（）：，杜凡，张敏，单祖植，等基于语言模型的调度语音智能识别研究单片机与嵌入式系统应用，（）：龚俊怡，朱蕴璞，宋成桥嵌入式无线音频采集系统设计国外电子测量技术，（）：黄玉金，杨越，薛伟，等无线模块的指令透传设计电子产品世界，（）：，王波单片机的高音质播放器设计单片机与嵌入式系统应用，（）：刘衡祁芯片的高速接口设计与验证无线互联科技，（）：，通信作者：董振华，。（责任编辑：薛士然收稿日期：）

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？