收藏 分享(赏)

2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf

上传人:a****2 文档编号:3040941 上传时间:2024-01-18 格式:PDF 页数:45 大小:2.21MB
下载 相关 举报
2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf_第1页
第1页 / 共45页
2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf_第2页
第2页 / 共45页
2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf_第3页
第3页 / 共45页
2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf_第4页
第4页 / 共45页
2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf_第5页
第5页 / 共45页
2022中国汽车行业智能化功能模块系列研究:语音交互篇-亿欧智库 (2).pdf_第6页
第6页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、亿欧智库 https:/ reserved to EqualOcean Intelligence,March 20222022中国汽车智能化功能模块系列研究-语音交互篇前 言2 2 语音交互指的是人与设备通过自然语音进行信息的传递。近年来,随着相关技术的发展与数据的累积,语音交互功能已经在汽车、医疗、金融、教育等多个领域涉及使用。随着车联网和人工智能技术的兴起,越来越多的功能被搭载在车机上。层出不穷的功能与日趋复杂的界面对驾驶者在驾驶过程中的注意力进行了争夺。对于当前“人机共驾”阶段,语音交互技术的独特优势得以显现帮助驾驶者降低对车内设备的手动操作依赖,增加驾驶安全性。2021年开始,汽车智能

2、化发展成为当前行业的核心方向。经过长达一年的智能化发展,语音交互功能已成为汽车智能化发展的重要特征。主机厂语音交互业务的发展模式与供应商的软硬实力成为业内最为关注的话题之一。语音交互功能已经成为汽车座舱内最具代表性的智能化功能模块之一。亿欧智库作为长期关注汽车领域的研究机构,为了进一步深度洞察中国智能汽车各细分智能化功能模块的技术原理、市场现状以及竞争格局等问题,特此推出“2022中国汽车智能化功能模块系列研究”报告。2022中国汽车智能化功能模块系列研究-语音交互篇的研究将聚焦于语音交互功能在汽车领域的应用。本报告将对中国语音交互车端应用的技术原理、市场现状、标杆企业等进行全方面的拆解分析,

3、并对当前主流供应商与主机厂的产品进行多维度研究与解读,使行业内外人士可以更直观的了解当下中国语音交互在车端应用的发展进程与市场动态。nMtNpNtNzQrNsPpRqQqMmP6McM6MsQrRsQoMkPqQtQjMsQrQ9PqRtOMYmQtQwMqQuN目录CO N T E N T S语音交互车端应用市场现状与典型案例I.市场发展现状与主要玩家II.主机厂篇III.智能AI科技企业篇IV.互联网科技企业篇V.市场总结语音交互车端应用发展趋势预测I.技术发展趋势II.应用发展趋势III.产品形态趋势语音交互车端应用综述I.语音交互介绍II.语音交互技术解析III.语音交互发展驱动因素I

4、V.语音交互产业链梳理与产业图谱1.2.3.语音交互车端应用综述语音交互赋能车载智能终端,成为智能座舱生态构建的核心功能5 目前,语音交互功能作为汽车座舱智能化的标志性代表,与车内多种应用相结合,成为座舱生态构建的核心功能。2011年中国首个智能汽车语音助理概念出现,可实现命令词语音识别的同时,也标志着智能语音交互应用于汽车产业的开始。随着语音的智能化发展,语音交互在车端的应用已经度过萌生期与探索期,正处于快速发展的黄金期。阶段一:萌生期阶段二:探索期阶段三:黄金期201120122013201420152016201720182019202020212022科大讯飞发布第一代智能汽车语音助理

5、,上线命令词语音识别系统国内科大讯飞、虫洞语音智能助手上线微软推出个人助理Cortana,实现语音对话科大讯飞第二代语音助手发布,上线语音唤醒词、语音交互打断技术斑马智行2.0将语音交互从主驾拓展至副驾科大讯飞前装智能网联车机发布,打通车机与车联网功能服务斑马智能1.0搭载荣威RX5,以语音交互的方式连接用户,成为当时业内公认互联网汽车标杆蔚来ES8首次搭载Nomi机器人,使语音交互更加拟人化导航导航到固定地点导航到兴趣点增加途经点音频音乐广播有声读物通讯电话短信车辆基本控制空调天窗雨刷器车辆信息查询油耗胎压生活信息查询新闻/股票/限号天气/机票/酒店车载智能语音交互来源:亿欧智库小鹏发布行业

6、首创全系统功能覆盖,全场景连续对话功能,大大提升语音在车端的使用效率腾讯宣布开发车载微信,加速车内语音与应用结合发展的进程理想携手思必驰,发布车载四音区覆盖语音交互方案长安汽车UNI系列推出首个搭载了多模语音交互方案的量产车型长安UNI-T,语音交互开始由单模向多模交互方式适配语音交互链条涉及学科广泛,ASR、NLP与TTS成为车端应用关键6 语音交互所涉及的流程繁琐,涉及到从语言学到声学理论等多方面内容,同时在车端的使用需对特殊驾乘场景进行相应适配。在语音交互在车端应用过程中,ASR(包含信号输入、降噪以及音素选取等流程)、NLP(包含NLU与NLG,涉及词性标注与文本信息处理)、TTS(包

7、含语音的后端拼接合成,同时也是语音拟人化核心环节)成为三个关键环节,同样也是当前行业发展仍需深耕的单点技术模块。ASR(语音识别)语音语言学知识信号处理技术数据挖掘技术统计建模方法语音数据库语言数据库训练声学模型语言模型解码识别结果解码降噪特征提取自适应度语音信号4DST对话状态追踪NLU语音理解3ASR语音识别2对话输入与前端处理1NLG语音生成5Policy动作候选排序6TTS语音合成7对话输出8接收声音信号转化为音频信号并放大声源定位降噪去混响语音增强声源信号提取/分离将特征识别为状态,组合成音素(声学模型)根据语音表达的特点,选取音素所对应的正确的文字,最终完成由向量转化为文字的过程(

8、语言模型)亿欧智库:车内人机交互实现流程示意图NLP(自然语言处理)NLPNLUNLG分词词性标注句法分析文本分类信息检索信息抽取文字校对理解文本,提取信息表征学习信息提取歧义分解未登录词识别词性歧义消解未知词性识别依存句法分析短语句法分析深层句法分析深层学习句法分析文本表示学习分类信息需求理解资源质量度量结果匹配排序信息检索评价命名实体识别关系抽取事件抽取信息集成机器翻译问答系统自动摘要基于规则基于统计端到端的神经网络问句理解文本信息拾取知识推理抽取式摘要生成式摘要TTS(语音合成)前端语言分析后端声学系统T文本输入文本结构与语种判断文本标准化句读韵律预测文本转因素S拼接合成参数合成端到端合

9、成来源:亿欧智库辅助驾驶行业、技术与市场等多方因素驱动,语音交互车端应用正处发展黄金期7 据亿欧智库预测在高级别自动驾驶功能落地前,驾驶员在驾驶过程中依然无法做到完全“解放双手”。在当前的“人机共驾”阶段,语音交互仍然是车内最直接、最人性化、最安全的交互方式。随着语音交互技术的成熟,语音识别准确率大幅提升,已为语音交互功能上车提供了技术验证与支持,因此智能AI科技企业开始纷纷加码语音交互在驾乘场景当中的应用与落地。汽车用户对于语音交互的需求与兴趣高涨,驱动主机厂在语音交互功能上的智能化与差异化发展。在当前L3及以下级别的自动驾驶功能下,驾驶员在驾驶过程中无法解放双手。当前“人机共驾”阶段,“人

10、机交互”则更多需要通过语言来实现;L4及以上的高级别自动功能预计将于2025年初现;高级别自动驾驶来临前,语音交互仍然是车内最直接、最人性化、最安全的交互方式。随着技术端的快速发展,AI语音识别市场得到的快速发展。目前主流语音识别模型已经以深度神经网络为主导,神经网络的出现及普及为语音识别准确率的提升起到了重要作用;目前中国主流AI语音识别率已达到98%,逐渐提升的语音识别度也加速语音识别在车端的场景化应用。目前中国用户对于智能网联汽车的智能化功能感兴趣程度排名当中,智能语音交互功能已经仅次于辅助驾驶功能,位于第二位;汽车用户对于车载智能语音交互的需求不再是单纯的指令操控,而是更具有拟人化、情

11、感化的自然交流。用户需求的提升加速车企在智能语音交互功能上的深耕。34%38%39%40%37%30%9%11%15%20%30%35%1%2%3.5%6%1%202020212022E2023E2024E2025E亿欧智库:中国汽车市场各级别辅助驾驶功能搭载率及预测60%95%98%20112016202156.4%42.9%41.5%39.9%37.2%36.2%智能语音交互OTA智能视觉交互生命体征监测亿欧智库:2021中国汽车消费者智能化功能感兴趣程度来源:亿欧智库亿欧智库:2011-2021中国语音识别准确率变化趋势L1L2L3L4&L5智能抬头显示语音交互车端应用产业链错综复杂,供

12、需界限趋于模糊8 中国语音交互车端应用产业链可分为上游:数据/语料/标注供应商、语音芯片/模块供应商、云服务及架构供应商以及车企;中游:语音处理引擎及应用供应商、平台服务与整合供应商;以及下游车企。随着语音交品产品智能化与差异化的发展,不同供应商之间,产品与业务也逐渐产生交集,传统自上而下的单一供应关系也逐渐转变为合作与共建关系。车企作为产业链下游与需求方,在自研发展过程中,同样担当了供给方的角色。来源:亿欧智库亿欧智库:中国语音交互车端应用产业链供需关系图以“人机交互”为核心,针对多元场景提供丰富的语音技术方案,如降噪、全流程语音交互等;既可以为车企提供单点的功能模块,也可以提供整套的一体化

13、解决方案,是产业链中竞争最激烈的一环。智能语音处理引擎及应用供应商基于多种场景需求打造云服务器、云平台、云数据库等云端基础架构,为企业提供一站式上云服务;主要为以BAT为代表的互联网科技企业。云服务及架构供应商提供数据/语料/标注 位于语音交互车端应用产业链最上游,提供丰富的场景数据集与语料集,加速AI模型训练;提供支持大规模、高效率、多维度的数据处理服务,具体包括数据采集、数据标注。数据/语料/标注供应商 为AI语音企业或车企提供高性能、强算力的AI智能语音芯片;随着软硬件一体化的发展,芯片业务成为部分传统AI语音引擎及应用供应商的分支业务。语音芯片/模块供应商为车企提供可集成且具有高定制化

14、的服务平台;基于自身平台,与AI语音处理引擎供应商建立战略合作关系,将其单点模块功能嫁接或整合于自身平台上。平台服务与整合供应商位于语音交互车端应用产业链最下游,是最终产品的需求方,企业种类众多,同时发展模式与决策也大相径庭;当中包括以自研路线为主的造车新势力与采购为主的传统主机厂两类。车企头部的造车新势力企业,通常选择自研语音框架的模式,这种模式下,造车新势力除了本身的主机厂的角色外,既包括了一部分技术供应商,又相当于一个系统集成商;从产业层面,也为其他新势力主机厂提升用户体验提供了新的合作思路。造车新势力传统主机厂通常会考虑到成本因素,选择采购性价比更高的整体解决方案。传统主机厂产业链上游

15、产业链中游产业链下游提供语音芯片/模块部分企业业务分支提供语音芯片/模块战略合作/提供单点模块提供单点模块/整体方案提供平台服务/集成方案提供云服务及架构提供云服务及架构既是产业最下游需求方,同时也是同类企业的供给方中国语音交互车端应用产业图谱9数据/语料/标注供应商平台服务与整合供应商智能语音处理引擎及应用供应商主机厂云服务及架构供应商语音芯片/模块供应商传统车企造车新势力来源:亿欧智库注:以上为中国语音交互车端应用产业链当中的代表性企业 智能语音处理引擎及应用供应商位于产业链中游,作为上游的需求方,业务范围逐渐向上延展;作为下游的供应方,合作模式逐渐向下深入。随着产业链中游企业的业务发展向

16、上延展与向下深入,产业链上中下游的边界趋于模糊,产业竞争结构正在发生重组。语音交互车端应用市场现状与典型案例语音交互车端应用市场持续增长,语音交互功能已成汽车座舱标配11 语音交互车端应用市场正在呈现出多元化的发展趋势,本地+云端、ASR、NLP、TTS、多元化内容及服务生态都在持续快速升级。经亿欧智库测算,2021年中国语音交互车端应用的市场规模为22.2亿元,2022年预计可以到达25.1亿元,2019年-2022年复合增长率达到20.8%。2021年中国新发布乘用车当中,语音交互功能在座舱内的渗透率已经位于第4位,高达86%。显然,语音交互功能已经成为中国乘用汽车座舱内的标配功能。11.

17、8 16.9 22.2 25.1 2019202020212022E56.3%72.2%72.6%81.3%85.8%86.0%91.8%92.5%97.9%远程启动手机互联智能座椅车联网智能后视镜语音交互智能方向盘可触控中控屏中控彩屏数据来源:亿欧智库2021中国汽车座舱智能化发展市场需求研究报告亿欧智库:中国语音交互乘用车端应用市场规模(亿元)亿欧智库:2021中国新发布乘用车(含改款)座舱智能化功能渗透率CAGR:20.8%来源:亿欧智库13.3亿元主机厂、智能AI科技企业与互联网科技企业合作助推市场发展12 随着中国语音交互车端应用市场规模的增大以及车内语音交互功能的渗透率提升,越来越

18、多的供应商纷纷瞄准了这一存在巨大潜力的市场。中国语音交互车端应用市场参与主体根据企业特征可以划分为三类:产业下游选择自研或半自研发展路线的主机厂,如“蔚小理”等;细分种类繁多的智能AI科技企业,这当中专注语音交互的AI处理引擎供应商与平台服务商为主要参与主体,如科大讯飞,思必驰、博泰车联网等;具有生态优势的互联网科技企业,如华为、腾讯、阿里、百度等。132中国车载语音交互市场三方共建,助推发展互联网科技公司 多数企业已在消费电子与To C端业务当中取得成功,具有足量的用户群体;拥有优秀的平台与生态能力与整套的全栈语音交互解决方案;拥有独特的杀手锏应用或者黑科技;合作模式更加开放,单点功能会选择

19、与智能AI科技企业合作。造车新势力 具有较强的语音交互软件开发能力,会选择自研语音技术框架的发展模式。语音交互产品当中,既是需求方,同样也是部分供给方。传统主机厂 语音交互的软件能力较弱,自研语音技术框架段时间内存在难度,具有雄厚的资金,通常选择采购的方式进行语音交互的产品发展。AI处理引擎及应用供应商 以“人机交互”为核心,针对多元场景提供丰富的语音技术方案。语音芯片/模块供应商 打造高性能、强算力的AI智能语音芯片,通常提供软硬件协同设计的云端芯一体化整机方案。平台服务与整合供应商为车企提供整合式全语音解决方案与定制化平台,满足客户极高的定制化需求。云服务与架构供应商 为企业提供便捷的一站

20、式上云服务与云网络解决方案。智能AI科技企业数据/语料/标注供应商 提供丰富的场景数据集,加速AI模型训练。来源:亿欧智库主机厂篇语音交互车端应用市场现状与典型案例造车新势力与传统车企各自语音交互产品的发展模式如何?语音交互产品车端应用当中,哪些企业与车型有亮眼表现?主机厂该如何选择适合自身定位的发展模式?主机厂在与供应商合作时应当考虑哪些因素?本篇章重点对以下问题进行解答新势力注重产品智能化与差异化的可持续发展,传统车企追求方案性价比14 对于语音交互功能的理解与发展模式,造车新势力与传统车企有各自不同的考量因素与决策方向。对于造车新势力而言语音交互产品是其打造品牌差异化的重要利器,自研框架

21、可以帮助主机厂更灵活地定制各种不同的功能,拥有不受制于供应商的开放能力,实现长久可持续发展;对于传统车企而言,语音交互产品的差异化与智能化并非是其吸引用户的关键因素,因此采用相对高性价比,低投入的通用方案是其所青睐的发展方向。亿欧智库:车企语音交互产品发展决策区域模型采购合作自研传统车企智能化水平:语音交互功能的智能化水平,例如识别精准度、语音自然度、语种丰富度、多音区覆盖等。产品差异化:与竞品相比,语音交互功能智能化水平之外的个性化空间与表现。模式可持续性:当前发展模式是否可以长期持续且具有可复制性。成本投入:在类似产品体验下采用不同落地方案所需要的资金投入及人力投入。核心考量通用方案个性化

22、方案车企决策行为区间对于大部分传统车企,则倾向于选择可以提供高性价比的整体解决方案(引擎+内容+服务生态)的供应商,对于语音交互功能的成本投入成为其考量的核心因素;这种依靠长期“购买”的方式到达一定阶段后,会导致:车企之间的产品同质化问题日趋严重:产品智能化水平无法得到突出体现。直接采购语音公司提供的技术,车企在之后做跨垂类生态打通时将会遭遇很大的瓶颈。车企语音交互功能发展决策四大考量因素智能化水平产品差异化模式可持续性成本投入来源:专家访谈、亿欧智库合作自研采购造车新势力新势力车企将倾向于打造自有的交互平台,并融合多家供应商技术引擎。目前已有部分头部新势力的方案落地。自研+深度合作的发展模式

23、需要主机厂自上而下重新定义汽车屏幕、按键、操作系统、上层应用,甚至车内各类ECU的功能,且包含开放可定制的特征,最终形成从设计、研发到生产的整体闭环;相较于采购的发展模式,这种模式使产品智能化与差异化得以体现,同时自研路线更是主机厂长久可持续发展的根本。头部造车新势力倾向自研路线,产品智能化较传统车企存在一定优势15 造车新势力将语音交互功能作为其产品智能化与差异化的核心体现,因此通常会选择自研搭建智能语音技术框架,以提高智能语音助手的功能迭代与优化的频率以及便捷性。从当前各车企语音交互功能的智能化配置来看,造车新势力的语音交互功能的智能化水平依然存在一定优势。传统主机厂通常选择外部合作的发展

24、模式,但头部的传统主机厂也开始逐渐发力,全双工、多音区覆盖等核心功能也已搭载上车。领先车企语音交互功能智能化配置语音产品名称唤醒语是否支持可定制化形象最近一次含语音功能的OTA全双工音区覆盖范围连续对话可见即可说是否支持自动驾驶场景应用发展模式供应商/合作商小鹏小P你好,小P支持小P语音形象与技能自定义;不支持自定义唤醒词2021.07支持双音区语音识别;双音区锁定支持(20s-120s)支持支持自研+合作思必驰、科大讯飞、微软蔚来NOMI嗨/嘿,NOMI支持自定义唤醒词/形象2021.08支持四音区语音识别:三音区锁定支持(20s)暂不支持支持自研+合作科大讯飞理想理想同学理想同学不支持自定

25、义唤醒词/形象2021.12支持六音区语音识别;支持(20s)支持支持自研+合作地平线、思必驰、科大讯飞长安UNI小安小安,你好召唤妲己召唤李白相关信息表示只有原声和妲己、李白语音包,定制化不明显支持支持(时长未知)不支持不支持非自研梧桐车联、地平线、科大讯飞吉利领克09系列专属形象JOJO嗨,领克你好,领克3D虚拟助手支持形象定制;自定义爱称、唤醒词及语音包;根据用户语音习惯形成个人词库2022.03支持四音区语音识别(领克09)领克09支持支持不支持非自研亿咖通、百度Apollo上汽荣威小跟斑你好,斑马支持定制化形象2021.07支持双音区语音识别支持(可设置30s、60s、90s)支持不

26、支持非自研斑马宝马宝马智能个人助理兼容宝马车载天猫精灵嘿,宝马你好,宝马天猫精灵支持自定义唤醒词;支持自定义语音助手名字2021.12支持支持不支持不支持自研(宝马个人助理)+合作微软、阿里、Cortana、Alexa、Google Assistant大众ID你好,大众支持唤醒词的自定义支持支持不支持不支持非自研大众问问、出门问问来源:亿欧智库小鹏首创全系统功能覆盖、连续对话等多功能,优秀智能化表现成其标签16 小鹏在产品设计上,基于全车扬声器分布,推出的全系统功能覆盖、连续对话等多种行业首创功能为其取得行业领先地位,符合其极客定位。对于语音交互功能的更新迭代也通过“OTA+云端”的高频迭代方

27、式,实现用户无感情况下的语音助手优化。智能语音交互助手小P更像是用户专属的助理与朋友,通过定制装扮、多种音色选择与定制化语音暗号建立小P与客户的独有联系。之后小鹏将继续优化提升语音交互的基础能力与语音包与应用场景的丰富度,同时也将座舱内部分语音相关的软件应用通过“软件收费”的方式进行开放。原始音频特征提取识别系统VAD系统语义理解音频是否有效否拒绝识别是输出结果对话系统实现中控屏所有元素的可见即可说,未来车机应用服务都将满足语音交互控制全系统功能覆盖可以让用户一次下达多个指令或打断上一指令(目前具备20秒-120秒连续对话)连续对话能力语音交互助手可通过个性化装扮、多种音色选择与定制化语音暗号

28、,满足用户个性化需求定制化形象通过前端降噪及声源定位,可设定接受指令的区域双音区锁定能力驾驶员语音指令发布后,会优先进行驾驶安全性判断再进行执行自动驾驶场景应用整车OTA升级外,通过后台及云端系统的实时修改,实现用户无感情况下的语音助手优化高频率的产品优化通过前端降噪及声源定位,可设定接受指令的区域语义据识 小鹏目前尚未开通语音交互应用收费项目;未来随着语言包、内容生态的丰富,会通过订阅服务的方式进行语音交互相关软件功能应用。深耕基础声纹识别能力,提高语音识别的精准度;语言包的扩充,未来进行产品出口,需要多种语言包;提高内容丰富度;通过用户需求调研,进行多场景的挖掘;进行多域融合的发展。来源:

29、小鹏汽车、专家访谈、亿欧智库智能座舱的联网服务分为系统流量服务与增值服务。系统流量:由主机厂承担,用于基础应用,例如语音、导航;增值服务:以涉及到版权的内容服务为主。目前主机厂对于增值服务当中的流量以赠送的形式回馈于用户,之后活动结束后,用户需要进行付费购买流量。小鹏语音交互发展方向小鹏语音交互功能服务模式系统流量服务增值服务小鹏语音交互商业化模式亿欧智库:小鹏扬声器分布示意图前门低音扬声器后门低音扬声器重低音音响头枕扬声器前门中音扬声器前门中音扬声器升降高音扬声器前门低音扬声器B柱高音扬声器B柱高音扬声器后门低音扬声器环绕扬声器顶棚高音扬声器中置扬声器外置功放蔚来赋予NOMI具有情感的拟人化

30、形象,助其成为“蔚来的灵魂”17 蔚来智能语音交互助手NOMI,源于蔚来对于语音交互体验的理解“Know me”,其集成了语音交互系统和智能情感引擎,被赋予了具有感情的拟人化形象,使蔚来的汽车产品从机器演变成了具有生命的驾乘伙伴。蔚来的NOMI智能语音交互助手的语音技术是在科大讯飞的支持基础上进行了个性化设计与改造。NOMI听音辨位、免打扰独立音区交互等功能,可帮助其后排乘客进行语音交互的体验。NOMI作为车的化身,致力于让汽车成为有生命、有情感的伙伴;以懂你、极简易用作为产品体验目标。语音交互产品情感化形象NOMI重视语音助手人设与形象的完整性与一致性。实体形象存在,脱离屏幕操作限制,情感化

31、TTS,形象更立体,屏幕表情增加视觉联系。语音交互产品拟人化形象 蔚来目前在语音交互C端商业化推进上较为克制,以用户满意度与体验提升为重心。将优先布局可见即可说,之后将考虑引入车家互联垂类;蔚来智能语音交互系统可帮助后排乘客体验语音交互。同时未来尝试在同一时间对多人的多个指令进行识别与执行,以期每个动作互不影响。并基于该功能为不同乘客量身定制更多的专属服务。通过多模态融合向系统输入和反馈更多场景信息,逐步实现从用户主动式交互向机器建议式交互发展;在实现机器建议式交互之后,机器通过对用户行为习惯的持续学习,逐步向机器主动式交互发展。“伙伴”产品定位之下,NOMI不考虑声音复刻/个性化VPA形象/

32、多终端搭载等发展方向,相比其他新势力更重视语音助手人设与形象的真实性。驾乘伙伴产品定位来源:蔚来汽车、专家访谈、亿欧智库蔚来语音交互发展方向蔚来语音交互商业化模式赋予其拟人化与情感化形象亿欧智库:蔚来扬声器分布示意图环绕扬声器高音扬声器低音扬声器双音圈低音扬声器低音扬声器高音扬声器环绕扬声器中置扬声器理想智能语音交互产品“理想同学”另辟蹊径,产品定位契合车型定位18 理想智能语音交互助手“理想同学”的产品定位完美契合理想ONE中高端家庭用车的车型定位,以全车语音覆盖、座舱全成员平等交互权利等特点,满足家庭出行场景的语音交互需求。理想同学基于其产品用户画像,深耕4音区以及开拓多音区覆盖,使车内所

33、有人员均可通过语音进行人机交互,同时也将从整车交互的角度进行场景化的思考,贴合家庭出行用户使用习惯。多音区:深耕4音区以及开拓多音区覆盖,使车内所有人员均可语音识别。应用场景:从整车交互的角度进行场景化的思考,贴合用户使用习惯。立体交互:使交互抛开硬件设备的限制,让车内所有人均可进行平等的立体交互。产品的打造基于理想One整车产品定位相契合的家庭用车,“全车语音”的产品特点使其满足“家庭用车”的使用场景需求。“家庭用车”相契合产品定位家庭用车后排空间使用率高全车语音覆盖座舱成员平等交互权利用户好感提升来源:理想汽车、专家访谈、亿欧智库理想语音交互发展方向 多模态交互:未来车型搭载摄像头后开始相

34、应布局。可见即可说:目前仅支持QQ音乐与喜马拉雅,之后持续挖掘,致力上线的所有APP均可用。软件服务无计划:理想没有对于消费者进行后续收费软件服务的计划。已存在收费形式:未来可收费项目基于用户手机端已形成的付费服务习惯进行设计,如音乐、视频会员,而非理想提供的软件服务。硬件收费:目前硬件设备仅有麦克风为收费项目,后续机会尚未明确。理想语音交互商业化模式理想四音区与扬声器的密集分布的配置与设计支撑理想ONE“家庭用车”的客户需求,提升后排空间使用率,打造全车语音覆盖、平等交互权利等理念。亿欧智库:理想四音区与扬声器的密集分布的配置中置中音扬声器高音扬声器环绕扬声器超低音扬声器外置功放前门中低音扬

35、声器前门中低音扬声器后门被动两分频后门被动两分频传统车企亦有亮点表现,聚合力与适配力成为其打造产品力的关键因素19 不同于新势力的自研发展路线与产品个性化定位,传统车企通常选择合作的方式发展语音交互相关业务。目前,部分较为开放的传统车企已经摒弃整包的一体化解决方案,而是选择接受不同供应商的服务。传统车企需要将各个领域最优秀的技术整合在一起,完成个性化的语音产品设计,更好地赋能其提升跨垂类生态打通的灵活度。在此过程中,车企的强大的聚合能力与适配力成为核心竞争力。来源:长安汽车、领克汽车、亿欧智库长安UNI-T 腾讯梧桐车联:TINNOVE智能系统;同时腾讯的背书使车载微信集成上车;地平线:Hor

36、izon Halo 车载智能交互方案:通过结合语音、唇动等多模态 AI 技术,准确判断声音指令的来源位置,避免误唤醒,遇到打电话时座舱还能自动降低音乐的音量;科大讯飞:语音控制系统。合作商特色功能交互智能化车载微信支持多场景语音控制、无需唤醒、可见即可说等功能,同时可以通过“召唤妲己”“召唤李白”等热门IP角色名进行语音交互;多场景语音交互实现车控功能,包括导航,播放音乐、座椅加热、车窗升降等,同时车内设置照相机,可以通过语音进行拍照控制;车辆启动后自动刷脸,无感登录账号,同步登录QQ音乐、腾讯地图等生态账号。与腾讯合作,配备全语音交互车载微信。AI交互灯车内设置AI交互灯,可根据人和车的实时

37、交互生成动态光效,对驾驶者进行有效的信息提示领克09 亿咖通:为领克09LYNK OS智慧座舱控制系统打造专属AI虚拟助理“JOJO”百度Apollo:百度Apollo赋能LYNK OS生态庞大、不断更新丰富车载智能小程序。小程序通过云端部署,无需下载、即点即用,全方位涵盖出行、视听、娱乐、新闻等用户出行需求。合作商 在语音交互方面,用户唤醒和语音识别几乎可同时完成;全双工加多音区技术,可实现多人整车环境下的语音持续交互;语音可实现车窗、空调、座椅、香氛等车控功能,发起导航、音乐等应用需求。交互智能化语音助手特色功能 新的3D虚拟助手“JOJO”支持形象定制,车主可在领克APP上传照片自动生成

38、虚拟形象投射至车机画面中;系统可为“JOJO”设置自定义爱称、唤醒词及语音包。单一账号支持5个自定义形象、5种自定义语音包。语音交互车端应用市场现状与典型案例智能AI科技企业篇不同类型供应商各自具有哪些优势?对于主机厂当前的发展模式,供应商应该如何做出应对?本篇章重点对以下问题进行解答头部传统车企/其他新势力行业巨头凭技术优势已俘获众多客户,新秀企业持性价比与定制化奋起直追21 AI科技类企业数量众多且竞争激烈,有已经深耕车载语音交互多年的行业巨头,也有伴随着汽车智能化发展浪潮涌现出来的行业新秀。于科大讯飞、思必驰、云知声等行业巨头而言,其客户涵盖范围广泛,产品技术水平与业务涵盖范围是其可以占

39、据高市占率的核心优势,但对于众多客户而言,无法全部提供高定制化的解决方案。而对于语音交互车端应用市场的行业新秀,产品的价格优势与极具定制化的解决方案成为吸引客户的关键因素。传统车企头部新势力行业巨头技术水平:与竞品相比,语音单点功能模块的技术水平,例如语音识别准确度、自然度、丰富度等。定制化服务:可以满足所有客户的定制化需求。业务涵盖范围:语音交互在车端应用的产业链条复杂且繁长,企业业务能力涵盖多个链条。产品价格:相较于竞品,为客户提供价格更低的处理引擎或性价比更高的解决方案。行业新秀核心优势通用方案定制化方案客户范围对于具有丰富项目经验的行业领先企业,技术水平与业务涵盖范围为其核心优势。这类

40、企业不仅可以提供各种单点功能模块的服务,还可以提供整体解决方案,因此其客户范围涵盖传统主机厂至造车新势力的全部车企类型。然而;由于客户体量较大,涵盖范围较广,当前无法满足所有客户的定制化需求;部分销量不足的新势力车企,对其不具有较强的合作吸引力且议价能力较低。因此对于这类新势力企业无法提供最具优惠的产品与方案。语音交互车端应用的新秀企业,通常为发展前期,且客户主要为传统车企。这类新兴势力以极高的定制化服务能力与更具性价比的产品方案打入市场。相较于行业领先的企业,新兴势力 技术水平存在一定差距,且产品能力尚未得到充分验证;通常业务范围仅为单一的功能模块或黑科技,存在合作局限性。亿欧智库:语音交互

41、(车端应用)智能AI科技企业发展核心优势模型语音交互(车端)智能AI科技企业发展核心优势技术水平定制化服务业务涵盖范围产品价格传统车企头部传统车企/其他新势力头部新势力来源:亿欧智库智能AI语音行业巨头以技术服务立足,客户需求加速其多元化发展22 以科大讯飞为首的AI智能语音行业巨头依托自身单点功能模块的技术优势在语音交互车端应用行业中占据优势,同时在用户需求、客户需求、行业发展以及技术发展的驱动下逐渐从单一的智能语音技术服务商转型为全方位人工智能技术服务商。目前科大讯飞与思必驰已累积多家车企客户,而云知声则主要通过与车载应用开发商以及车企孵化的Tier0.5进行合作,间接布局语音交互车端应用

42、的市场。单一智能语音技术服务商全方位人工智能技术服务商 用户需求:产品体验更加专属、个性化、更有乐趣。客户需求:a)新能源发展,传统主机厂受到影响逐步转型,产销服运的智能化需求增加;b)部分主机厂客户逐步定位为科技出行服务公司,从而对上游供应商提出需求智能网联、个性化;c)客户制造工艺升级、渴望用新技术改变传统制造流程,此过程中需要供应商进行配合。行业技术:行业技术发展已有将为成熟的数据与技术基础,如数据智能(大数据)、AR智能(感知+认知)、硬件(作为载体)与软件一体化。企业技术:需要差异化与定制化方案满足客户需求。AI智能语音科技公司科大讯飞思必驰云知声语音交互产语音交互产品品典型合作典型

43、合作企业企业企业优势 目前语音交互在车端应用行业中的佼佼者,采用云+端的技术架构,擅长多语种识别、多语种合成、生物识别等;针对车端推出飞鱼音频管理系统,可实现全车独立声场分区,实现主驾、副驾、后排乘客互不干扰的语音交互模式。飞鱼智能音频管理系统,具有虚拟声学空间、发动机主动降噪、车内交流补偿等智能车载音响系统技术。全链路对话式人工智能技术的平台;能够提供所有链路技术节点的快速复制,并具备高可用、可定制等特点;针对车端推出“天琴”语音助手,其以语音识别、语音合成、多音区(双音区/四音区)声源定位、声纹识别、方言识别、知识图谱(智能客服、汽车大脑)等核心技术为基础,为车企提供流畅的对话体验。云知声

44、利用机器学习平台,在语音技术、语言技术、知识计算、大数据分析等领域建立了领先的核心技术体系。在应用层面,AI芯、AIUI、AI Service三大解决方案已在车载领域有广泛应用,形成了完整的“云端芯”生态闭环来源:科大讯飞、思必驰、云知声、亿欧智库行业巨头技术差距逐渐缩小,定制化服务与性价比亦是企业关注焦点23 科大讯飞、思必驰与云知声三家企业作为国产AI智能语音科技公司的优秀代表,各自均有不同维度的优势。在技术层面,通过MOS评分的方式进行多维度对比;在降噪处理、语音自然度、相似度、准确率、可懂度、种类以及可离线程度等技术维度,科大讯飞依然存在不同程度的优势。其中,降噪处理、语音相似度、准确

45、率以及可懂度,三家企业已无明显的技术差距。在价格与定制化服务层面,通过行业访谈与公开资料分析,可见思必驰在价格层面具有一定优势,而云知声则通过优秀的定制化服务能力打造业内口碑。网络稳定性对合成语音好坏的影响;合成语音的速度快慢;语速是否适当;是否存在重复吐词或漏字;韵律停顿的使用;听起来是否有机械感。语音自然度的满分是5分,人声平局约为4.7-4.8分。语音自然度语音产品与方案的价格。价格在无网络下的功能表现。可离线程度涉及语种、方言、音色等的种类。语音种类对语音中有意义的语言单元内容的可识别程度,一定条件下的语音理解能力。一定程度上对语音清晰度提出要求,因此涉及降噪功能。语音可懂度识别准确率

46、语音识别中的字准率、句准率。语音相似度与人声的相似程度。语音产品的噪音处理能力。降噪处理定制化服务能力供应商对于语音产品合作的沟通能力与定制化服务能力。企业语音交互评比维度012345语音自然度语音相似度识别准确率语音可懂度语音种类可离线程度价格定制化服务能力降噪处理讯飞云知声思必驰来源:专家访谈、亿欧智库亿欧智库:2022中国AI智能语音科技公司产品力、价格及服务能力分析科大讯飞算法与硬件深度融入,数据与技术成为其立足根本24 科大讯飞自2011年发布第一代智能汽车语音助理至今,以其AI技术、软件质量、数据积累以及定制化服务能力等各方面优势取得了当前中国语音交互车端应用行业的领先位置。科大讯

47、飞未来将持续深耕软硬件结合的发展模式,充分发挥其AI优势融合特殊芯片,控制成本,为低配车型提供高性价比的解决方案。同时利用自身快速集成与开发的能力优势以满足客户快速更新需求。20112013201520182022核心诉求:交互更安全特征与技术发展:1、车内降噪2013年科大讯飞发布首款智能降噪系统,将识别与降噪融合。2、语音服务2013年前为发展起步阶段,此后快速发展,带来语音识别准确率提高的好处。起步阶段发展阶段二发展阶段一发展阶段三核心诉求:交互更自在特征与技术发展:1、自然语言理解围绕该主题的深度学习算法。2、场景服务创新对于车控等服务快速落地。3、语音交互技能讯飞的许多语音平台,语音

48、生态逐渐建立,AIUI开放平台为交互自然提供基础。4、基础设施与云如车机、IOT设备,万物互联的相关应用快速涌现。核心诉求:交互更个性特征与技术发展:1、交互个性化由于年轻人购车需求驱动,新科技普及、用户体验需求增加,科大讯飞重视用户体验以及语音拟人化,使交互更有乐趣。2、语料的扩充2019年起三四线城市汽车普及率升高,照顾更多人群分类,科大讯飞开始重视方言的发展,扩充语料3、语音分离例如科大讯飞的两音区、四音区4、软硬结合讯飞开始语音芯片相关业务发展科大讯飞发布第一代智能汽车语音助理,上线命令词语音识别系统。亿欧智库:科大讯飞智能语音车端应用业务发展历程AI技术优势软件质量定制化服务数据积累

49、创新理念语音识别、语音理解等各模块行业领先的技术与算法20年的行业积累,拥有海量的数据沉淀采用本地化+云端的技术架构,多语种识别、多语种合成等质量优势与部分车厂一起深度优化打磨,做场景创新倡导整体的系统化创新而非单点创新,以解决用户真正的问题,强调用户价值来源:科大讯飞、亿欧智库科大讯飞发展方向 专注产品成本、质量、体验、效率的平衡;软件与应用的发展强调硬件资源,但通用芯片的通用算法存在匹配度不足的问题。之后将发力软硬深度融合设计;客户存在多车型与高低配,用户与客户针对低配车仍期望良好体验,未来将推出高性价比的AI算法+语音芯片的融合方案。科大讯飞客户数量多、不同客户产品需求存在差异的矛盾,对

50、讯飞资源投入提出挑战。面临挑战 进行产品平台化设计;利用积累的行业经验系统化开发,将共性问题导入主线开发解决共同问题;加快在用户体验上的发展。解决方案新秀企业来势汹汹,性价比优势与多元化发展模式为破局思路25 车内智能语音交互随着自动驾驶功能的发展逐渐成为刚需,行业已经进入发展黄金时期。众多车载AI智能语音新秀企业入局,其中不乏主机厂孵化的车载语音科技公司,以及将车载场景应用作为新业务领域拓展的AI智能语音科技公司。相较于科大讯飞这类在行业深耕多年的老玩家,新秀企业以单点功能的极致技术、性价比更高的解决方案以及更具创新的合作模式,在行业内展露锋芒。将车载语音作为新业务领域拓展的AI智能语音科技

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用范文 > 工作总结

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2