1、群内每日免费分享5份+最新资料 群内每日免费分享5份+最新资料 300T网盘资源+4040万份行业报告为您的创业、职场、商业、投资、亲子、网赚、艺术、健身、心理、个人成长 全面赋能!添加微信,备注“入群”立刻免费领取 立刻免费领取 200套知识地图+最新研报收钱文案、增长黑客、产品运营、品牌企划、营销战略、办公软件、会计财务、广告设计、摄影修图、视频剪辑、直播带货、电商运营、投资理财、汽车房产、餐饮烹饪、职场经验、演讲口才、风水命理、心理思维、恋爱情趣、美妆护肤、健身瘦身、格斗搏击、漫画手绘、声乐训练、自媒体打造、效率软件工具、游戏影音扫码先加好友,以备不时之需扫码先加好友,以备不时之需行业报
2、告/思维导图/电子书/资讯情报行业报告/思维导图/电子书/资讯情报致终身学习者社群致终身学习者社群关注公众号获取更多资料关注公众号获取更多资料目 录CONTENTSCONTENTS一、云智一体,促进数字化转型与智能化升级一步到位.021.1 产业智能化,数字经济发展新阶段 .031.2 百度智能云战略 .031.3 云智一体的百度智能云架构2.0,加速产业智能化 .03二、UNIT 7.0,助力企业应用全面迈入“智能对话+”时代.052.1 对话式AI成为企业智能化升级的首选批产品 .062.2 顺势而为,UNIT 7.0全新发布.07 2.2.1 跨模态对话引擎 .08 2.2.2 知识引擎
3、.11 2.2.3 洞察引擎.13三、UNIT 7.0背后的核心技术.153.1 自然语言处理 .16 3.1.1 百度PLATO-XL对话大模型 .163.2 智能语音技术 .18 3.2.1 智能语音技术的挑战.18 3.2.2 SMLTA 2 语音识别模型 .19 3.2.3 方言大一统模型 .20四、智能对话场景化产品与方案.214.1 企业对客服务的演变趋势.224.2 三大产品应用 .23 4.2.1 智能视频客服 .23 4.2.2 智能培训.24 4.2.3 智能客服一体机 .254.3 五大场景化方案 .25 4.3.1 全渠道智能客服.25 4.3.2 数字理专 .27 4
4、.3.3 电力调度机器人.28 4.3.4 客户之声VoC.29 4.3.5 智能公众服务热线 .30五、百度智能对话的成功实践.315.1“智能对话+金融”场景.32 5.1.1 浦发与百度的智能金融创新硕果 .325.2“智能对话+运营商”场景.34 5.2.1 业务痛点.35 5.2.2 解决方案与效果 .355.3“智能对话+能源”场景 .36 5.3.1 业务痛点.37 5.3.2 解决方案与效果 .37 5.3.3 合作模式推广.39六、共生共赢的智能对话生态体系.406.1 生态伙伴优选供应商合力亿捷.42七、更多行业案例参考.44八、关于本报告.45云智一体,促进数字化转型与智
5、能化升级一步到位“云智一体”技术与应用解析系列白皮书 【智能对话篇】02云智一体,促进数字化转型与智能化升级一步到位1.1 产业智能化,数字经济发展新阶段当前,我们正处在科技创新和产业发展最好的时代,以人工智能、大数据、云计算、5G等为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革。在产业应用新兴技术和数据资源转型升级的过程中,数字化是基础;而随着人工智能等新一代信息技术的发展,以及数据的爆发式增长,产业加快应用智能技术,从海量数据中发现规律、训练模型、提炼知识,促进产出增加和效率提升,实现企业生产经营的智能化,进而实现整个产业的智能化升级。因此,数字经济既包括数字化转型,也包括智
6、能化升级,产业智能化是数字经济发展的新阶段。1.2 百度智能云战略百度是拥有强大互联网基础的领先AI公司。从成立的第一天起,百度搜索引擎就与人工智能、云计算等技术息息相关。经过多年的技术积累和产业实践,百度已形成了全面布局,从基础的算力和数据技术、深度学习算法及框架,到语音、视觉、自然语言处理、知识图谱等感知、认知技术,以及飞桨深度学习开源开放平台等。云智一体是百度智能云的独特优势。“适合跑AI的云”为数字化转型提供安全、稳定、灵活的数字化底座,“智能化引擎”为智能化升级提供领先的创新技术和平台,云智一体助力企业数字化转型与智能化升级一步到位。“适合跑AI的云”和“懂场景的AI”共同构成智能时
7、代基础设施。同时,如果客户只做数字化转型,我们有丰富的云计算产品可以支持;或者客户已经有了数字化基础,我们的智能化引擎也可以助力智能化应用。百度智能云的“云”,不仅为数字化转型提供安全稳定、弹性灵活的云计算服务,同时也是适合跑AI的云,我们称之为“AI原生云”,继承云原生的优势,面向AI场景,提供极致弹性的高性能异构算力,打造简洁、高效的AI应用开发架构。“云智一体”的智,是百度将深耕十余年的AI技术,以及AI赋能产业的实践经验,沉淀为助力产业智能化升级的技术、平台及方法论,是以加速产业智能化升级为己任、懂场景的AI。1.3 云智一体的百度智能云架构2.0,加速产业智能化云智一体的百度智能云架
8、构2.0包含数字化底座、智能化引擎和全场景应用(如图1.3-1所示)。03“云智一体”技术与应用解析系列白皮书 【智能对话篇】04数字化底座,包括基础云、数据库、物联网、边缘计算、区块链等基础平台,以及视频云、大数据、云原生开发和地图服务等;同时还有安全模块,为技术创新和产业转型升级保驾护航。在数字化底座之上是智能化引擎,百度自主研发的飞桨深度学习平台为核心,软硬一体AI大生产平台-百度大脑为支撑,包括AI中台和知识中台等。智能化引擎与行业深度融合,帮助企业建设自己的智能化中台,助力智能化升级。基于数字化底座和智能化引擎,百度智能云深入行业场景,打造智能应用,同时与生态伙伴一起,在制造、能源、
9、城市、金融、医疗、媒体等领域,助力数字化转型和智能化升级一步到位。(图1.3-1 百度智能云架构2.0)百度智能云:架构2.0云为底座 飞桨为核 生态为翼全场景应用智能化引擎数字化底座智慧城市智能客服视频云数据库计算存储网络安全基础云物联网区块链大数据服务云原生开发服务地图服务边缘计算智能推荐智能办公企业搜索工业质检智能创作智能制造智慧金融智慧交通智慧能源智慧医疗智慧媒体AI中台知识中台软硬一体AI大生产平台产业级深度学习开源开放平台我们希望以百度智能云为纽带,联合技术和产业生态伙伴,通过开源开放平台降低AI开发的门槛,加快人工智能融入传统产业,帮助越来越多的行业大步快跑,加入产业智能化的大潮
10、。UNIT 7.0,助力企业应用全面迈入“智能对话+”时代UNIT 7.0,助力企业应用全面迈入“智能对话+”时代05“云智一体”技术与应用解析系列白皮书 【智能对话篇】06在产业数字化、智能化进程提速的大背景下,人工智能成为驱动数字经济高质量发展的新动能。人工智能与产业发展的深度融合,可以充分释放技术进步带来的红利与叠加效应。随着语音、自然语言处理等人工智能技术的不断进化,作为人工智能产业落地的重要先行场景,“智能对话”在业务经营中的应用价值正在被越来越多的企业和组织认可与接受,全场景、多模态、拟人化的技术应用趋势也越来越清晰。如何正确认知“智能对话”的应用价值及技术发展趋势,确保核心竞争优
11、势,是当前企业和组织关注的重点问题。2.1 对话式 AI 成为企业智能化升级的首选批产品麦肯锡 2021 年 AI 市场调研显示,AI 在企业中的应用场景已十分广泛,覆盖服务运营、产品开发、营销和销售、供应链管理、人力资源管理等场景。其中,应用案例最为普遍且增长显著的领域是服务运营,包括服务运营优化和客服中心自动化。在服务运营领域的 AI 应用中,对话式 AI 是企业智能化升级的首选批产品,这是因为:降本增效收益明显:企业客服人员流动频繁,培训成本高,服务质量因人而异;人工服务成本与效率的业务痛点由来已久,优化效果易量化、可衡量。(图2.1-1 AI在服务运营领域广泛应用)AI 在服务运营领域
12、广泛应用并快速增长服务运营优化客服中心自动化基于AI产品增强新特性产品特征优化客户服务分析客户细分物流网络优化销售&需求预测预测性维护产量、能量和/或吞吐量风险建模&分析欺诈&债务分析资本配置资金管理人才管理优化绩效管理27%22%22%20%11%12%11%11%8%8%17%16%16%14%7%6%服务运营产品&/OR开发市场和销售供应链管理人力资源制造战略和公司财务风控UNIT 7.0,助力企业应用全面迈入“智能对话+”时代07技术与产品成熟度高:智能语音、智能对话等技术发展并应用了 6 年以上,在金融、运营商、电商等行业广泛落地,因此对话式 AI 产品具有较高的落地场景成熟度。用户
13、接受度高:“机器人 24 小时服务+人机协同”的服务模式,在自动通知、远程服务等场景具有良好的用户体验,被用户广泛接受。综上,从市场需求、技术可行性,用户接受度等方面综合考虑,对话式AI已具备更大规模应用的前提条件。2.2 顺势而为,UNIT 7.0 全新发布作为拥有强大互联网基础的领先 AI 公司,百度 2017 年推出了智能对话平台 UNIT(Understanding and Interaction Technology),坚持秉承更先进、更开放、更低门槛的理念,在对话任务类型的丰富性、对话理解和生成的核心算法效果、低成本训练工具、闭环运营工具等方面开展持续建设,并广泛应用在多种企业级和
14、消费级场景中。在人工智能技术与产业深度融合发展的大潮下,为助力企业应用全面迈入“智能对话+”时代,百度智能云在 2022 年 5 月全新发布了智能对话平台 UNIT 7.0,以及基于 UNIT 7.0 的对话类应用产品矩阵、行业场景化方案。百度智能对话平台UNIT发展历程(图2.2-1 百度智能对话平台UNIT发展历程)对话管理 任务式对话全链路对话定制系统 任务对话/FAQ/文档问答 预置技能 对话流编辑器 语音语义一体化丰富对话任务类型 任务式对话 FAQ问答问话强化对话能力 PLATO开放域对话 表格问答/图谱问答 全平台对话管理API闭环运营工具 冷启动数据模板/扩展/推荐/测试 运营
15、阶段问题定位、优化工具低成本训练工具 高精度小样本学习技术 FAQ自动挖掘、泛化 预置行业领域机器人跨模态对话+跨模态对话引擎 知识引擎 洞察引擎2.02018-071.02017-073.02019-055.02020-127.02022-054.02020-026.02021-09更先进更开放更低门槛“云智一体”技术与应用解析系列白皮书 【智能对话篇】08百度智能对话平台 UNIT 7.0 的技术底座由全新升级的跨模态对话引擎、基于对话场景的知识引擎、助力企业经营的洞察引擎等三大引擎组成,重点解决企业面临的对话场景复杂化、多轮交互常态化、信息量大且形式不一、数据资产无法有效利用等业务痛点。
16、(图2.2-2 百度智能对话平台产品方案全景图)智能对话平台UNITAI能力场景方案全渠道智能客服解决方案预置行业模型用户洞察服务洞察营销洞察知识生产知识组织知识应用多维分析模型数据富集工具效果优化工具跨模态理解(语言/情感/行为)任务式对话问答对话开放域对话对话流管理跨模态对话生成数字人驱动语音语言与知识视觉应用语音导航在线客服视频客服智能外呼智能质检客服助手智能培训来电秘书智能家居智能车载智能硬件数字理财专员电力调度机器人客户之声VoC智能公众服务热线企业级应用跨模态对话引擎对话管理对话能力知识引擎消费级应用金融能源能源城市运营工具洞察引擎百度智能对话平台产品方案全景图2.2.1 跨模态对
17、话引擎UNIT 对话引擎本身可以支持不同对话能力,如任务式对话、FAQ 表格等问答对话、开放域对话,同时还具备对话管理与运营等功能。在全新发布的UNIT 7.0中,对话引擎更是全新升级为“跨模态对话引擎”,在原有任务式对话、开放域对话等对话能力基础上进一步升级。UNIT 7.0,助力企业应用全面迈入“智能对话+”时代09 传统对话全流程:跨模态对话:从语言理解到跨模态理解,从语言生成到跨模态对话生成,同时融合数字人提供视觉、语音、语言一体化机器人构建能力从理解到对话生成,全链路升级为跨模态对话引擎在传统对话技术处理流程中,用户是以语音、文字的方式进行交流,经过语音识别、文本理解、对话管理等环节
18、流转,再基于文本进行语言生成,通过 TTS 技术反馈给用户。跨模态对话引擎则将全链路进行了升级:用户可以输入语音、文字、图片、视频等多模态内容,机器人则综合图片、视频及文字等输入内容综合理解用户意图(不再是基于文本简单理解用户),然后基于对话管理与跨模态对话生成等技术,为最终用户输出富媒体形式的、AI 辅助生成的内容,并驱动数字人跟用户完成多轮交流。(图2.2.1-1 全链路升级为跨模态对话引擎)在跨模态对话引擎的加持下,机器人对于富媒体形式的内容理解更聪明;支持的对话类型从文本对话、语音对话扩展至视频对话、数字人等新交互形态;内容呈现更丰富多元,不仅具备声音和大脑,还具备形象、表情与动作,与
19、用户的交互内容也支持富文本形态,极大提升了服务效率与用户体验。在需要确认用户身份信息、产品故障排查等复杂业务场景中,跨模态对话引擎可以显著提升对话沟通效率,对话轮次可降低 15%。语音/文字输入语音/文字输出语言理解语言生成对话管理多媒体输入跨模态理解对话管理多媒体答复跨模态对话生成 语音 文字 图片 视频ASR&意图理解多模识别&标签 跨引擎分发中控 对话流编排Taskflow语音富文本视频控制指令+数 字 人 富文本答复配置 AIGC(文本风格变更/文档片段自动提取)数字人驱动(唇动、表情及动作自动驱动)ASRTTS“云智一体”技术与应用解析系列白皮书 【智能对话篇】10 任务式对话自学习
20、能力跨模态对话引擎除了全链路升级外,还具备任务式对话的自学习能力。构建智能对话服务的传统方式,主要依赖于人工和专家经验,如人工标注意图与实体、设计对话流程及训练机器人等,大型业务的冷启动周期一般至少一个月起。通过任务式对话的自学习能力,将历史沉淀的对话业务数据作为学习语料,机器人即可自动生成潜在的意图与实体、对话流程等,人工只需做好筛选和修正即可。整个过程的冷启动难度和周期大幅降低,成本降低 50%;同时,相对于人工经验,任务式对话的自学习能力可以基于实际业务场景实现更广泛的意图覆盖。(图2.2.1-2跨模态对话综合提升服务效率与用户体验)跨模态对话综合提升服务效率与用户体验理解更聪明车报警声
21、音很大覆盖更全面呈现更多元产品营销咨询产品故障排查卡证信息收集主要特征Before:与用户文字交流,读懂文字含义After:读懂用户发来的文字+图片、视频、手势仪表盘显示您发动机冷却液温度过高,请立即靠边停车并关闭发动机覆盖文字对话、语音对话、视频对话等多场景多渠道,支持不同种类的对话能力,具备统一且强大的对话流管理能力文本对话语音对话视频对话数字人交互机器人不仅具备声音和大脑,还具备形象,表情,动作,与用户交互的答复内容支持富文本的形态核心价值可承接复杂场景提升对话沟通的效率平均通话轮次下降15%全面提升用户体验文字客服场景:文字交流-多模态信息交流电话客服场景:语音电话呼叫-5G VoLT
22、E呼叫支持 数字人视频呼叫支持UNIT 7.0,助力企业应用全面迈入“智能对话+”时代11任务式对话支持流程自学习,显著降低冷启动难度2.2.2 知识引擎如企业产品会持续更新换代,企业服务的内容和标准也会不断演进。因此,该类型知识的有效组织、利用与迭代更新,对于保证企业服务的有效性和高质量起着至关重要的作用。但在实际业务中,如培训资料、优质服务话术等大量数据并没有被有效组织与利用;知识的生产、组织及应用环节还存在着大量人工作业。基于百度知识中台构建的知识引擎,利用先进的人工智能技术大幅提升企业知识生产、组织和应用的效率,为企业挖掘数据资产价值打好坚实基础。具体如下:首先,基于对话场景的知识引擎
23、,大幅提升知识生产、组织和应用的效率,自动形成文档、FAQ、图谱等有组织的、多模态的知识内容,并在对话类场景中得到高效应用。其次,人工采编、审核等成本显著下降。举例来说,一篇三万字的文档,人工采编需约 3 小时,需经过文本内容理解、结构化与口语化处理、内容检查等多个环节;而基于知识引擎的自动化 FAQ 挖掘、自动纠错等能力,平均可缩短到 2 小时,采编周期缩短 20%以上。(图2.2.1-3 任务式对话支持自学习,显著降低冷启动难度)意图及实体自动检测 对话流程自动构建 百度沉淀任务式对话知识 大规模预训练模型行业意图数据集行业实体数据集行业对话流程集意图筛选实体筛选对话流程修正系统集成机器人
24、训练对话流程自学习人工构建全面提效对话数据任务式对话检测模型任务式对话大模型对话数据自动生成 意图 实体 对话流程冷启动阶段成本降低50%基于实际业务数据用户意图挖掘高频场景覆盖100%全新冷启动方案传统冷启动方案“云智一体”技术与应用解析系列白皮书 【智能对话篇】12此外,以往为了保障采编质量并降低服务风险,处理后的知识要成为企业对外服务的基础,还要经过审核流程甚至反复修订。基于知识引擎的“文档比对”功能,可快速定位差异内容、支持审核流程的灵活配置,大幅提升审核效率。最后,企业还可以基于知识引擎构建统一的对话场景知识中心,对知识集中管理与运营,汇聚海量的多元异构数据知识,还支持复杂的组织权限
25、及审批流等。可以支持人机对话、人人对话辅助应用等,保障服务内容的统一性、知识及时性与更新效率。(图2.2.2-1 知识引擎全流程智能化提升运营效率)UNIT知识引擎全流程智能化提升运营效率FAQ挖掘智能摘要相似问推荐文档智能解析图谱自动构建知识查重知识纠错敏感词识别文档版本比对审核工作流一键发布多版本管理快速查找数据分析看板知识分析看板语义纠错补全多模态搜索图谱检索相关推荐知识图谱视图个人收藏管理公文公告规章制度产品介绍操作指引服务流程解释口径培训资料对话记录工单小结活动说明文档知识FAQ知识图谱知识多模态知识百度知识中台多源异构数据全流程生产后台知识全流程智能采编知识加工智能审核知识运营个性
26、化知识门户知识浏览知识检索特色智能化价值提升采编周期审核周期减少20%减少30%提升20%知识查找首条满足率与此同时,在场景化知识利用方面,百度智能对话平台将知识引擎与对话引擎紧密结合,让整个对话过程随时参照 FAQ 问答对、数据表、业务文档等业务知识。以表格问答为例,平台支持基于知识引擎构建的数据表,一键导入到对话系统当中,并且通过预置的语义解析能力,去承接用户对于结构化知识的典型问法,如属性值查询、限定条件下的实体查询、最值与比较查询等。UNIT 7.0,助力企业应用全面迈入“智能对话+”时代13客户服务智能化进入业务价值发掘的新阶段对于更加原始的业务数据如对话日志,百度智能对话平台也提出
27、了意图、实体、对话流程等要素的自动挖掘机制。基于深度模型的文本分析、聚类及交叉验证,为开发者提供高质量的对话知识候选。同时,还在探索如何基于更加端到端的方式,直接基于对话数据、业务知识进行对话建模,进一步降低业务数据与知识的转换成本,最终降低整个对话系统的总体成本。2.2.3 洞察引擎对话式 AI 技术与场景应用经多年发展,已经从降本增效、服务体验优化的智能化服务阶段、演进到辅助经营决策的新价值探索阶段。从数据中挖掘业务价值,全生命周期了解用户需求并提供个性化服务,可以帮助企业实现“精细化运营”闭环。(图2.2.3-1 客户服务智能化进入业务价值挖掘的新阶段)基于人机对话、人人对话、工单数据、
28、调研问卷等企业对话场景沉淀的各类数据,洞察引擎通过运用标签分析、事件挖掘等 AI 技术对客服与营销对话日志做结构化的业务标签挖掘、情感分析等,提供用户洞察、服务洞察、营销洞察等多维度分析能力,帮助企业准确识别用户当前热点诉求、口碑风向,并将这些信息按照时间、地域等维度组织起来,构成分布与趋势分析,指导企业及时调整服务策略,提升服务质量,提升销售转化率。智能服务机器人 人机结合服务模式 降低运营成本 提升工作效率 用户全生命周期管理 用户分层及个性化服务 更全面的了解用户 优化服务&精准营销阶段1:服务智能化阶段1:降本增效 多渠道触达 服务全面性、一致性阶段2:全渠道一体化 实时+快速+全面的
29、服务 提升整体服务满意度阶段2:服务体验阶段3:服务创新阶段3:经营决策业务发展价值延伸“云智一体”技术与应用解析系列白皮书 【智能对话篇】14UNIT洞察引擎提供多维分析 赋能新角色UNIT洞察引擎助力多场景降本提效客服及销售沟通辅助 实时服务策略 实时营销话术 沟通风险预警 工单流程智能化运营管理监督 用户沟通合规监控 业务运营风险监控策略 人机协作策略管理 风险预判策略推荐业务分析渠道分析(门店/网点、人员、用户)竞对分析(用户提及竞品信息分析)产品分析(用户反馈分析)多维度分析全生命周期数据人机对话 人人对话 工单数据 调研问卷 用户行为洞察内容洞察内容洞察内容 用户特征偏好 用户核心
30、需求 竞品信息提及 用户行为预测 服务热点挖掘 问题根因分析 服务投诉预判 服务趋势分析用户洞察服务洞察营销洞察 绩优话术提炼 潜在线索挖掘洞察引擎可助力多场景的降本增效。举例来说,在工单场景中,洞察引擎在关键信息提取、自动填单、工单推荐、工单处理方案推荐等环节,保证准确率的同时,大幅提升工作效率;在客户之声 VoC 场景中,洞察引擎通过对售前、售中、售后等全渠道 400+多维标签的分析,可以使抽样数据覆盖率从 6%提升到全量 100%,单标签准确率超过 90%;在营销类场景中,洞察引擎通过对优秀话术的挖掘和推荐,以及对用户特征偏好、竞品提及和用户行为预测的分析,可以使单通电话通话时长增加 1
31、.62 倍,助力营销转化率的显著提升。(图2.2.3-2 洞察引擎提供多维度分析)(图2.2.3-3 洞察引擎助力多场景降本提效)准确率 91%工作效率提升 40%抽样6%-全量100%准确率 90%分阶段话术 采纳率86%10s内 挂电话量下降6%单通 通时增长1.62倍工单场景客户之声VoC场景营销场景工单关键信息提取、自动填单准确率 90%推荐成功率 80%类似工单推荐、工单处理方案推荐售前、售中、售后全渠道数据共400+多维分析标签6千条/月10万条/月数据覆盖单标签优秀话术挖掘及推荐用户特征偏好、竞品提及、行为预测UNIT 7.0 背后的核心技术15UNIT 7.0背后的核心技术“云
32、智一体”技术与应用解析系列白皮书 【智能对话篇】163.1 自然语言处理3.1.1 百度 PLATO-XL 对话大模型随着深度学习技术尤其是跨模态预训练技术的快速发展,百度在跨模态对话内容理解与生成的技术上,进行了更加深入的探索,构建了业界首个大规模跨模态对话语料库。结合百度 PLATO 大模型以及预训练的图文匹配模型,以统一的嵌入特征向量表达视觉与文本特征,实现端到端的跨模态对话训练,使不同模态的特征能够互相支撑,从而更好地把握对话过程中的跨模态关键信息。基于这一技术,百度智能对话平台已实现对开放域对话中图片输入的理解,以及表情包式回复的生成,相关应用已在百度多项产品线落地。(图3.1.1-
33、1 百度PLATO-XL)开放域对话升级至百亿参数模型PLATO-XL全球首个基于隐空间的大规模生成式开放域对话模型,参数规模高达百亿,具备接近真人水平的多轮聊天能力,中文模型和英文模型都达到了全球领先水平对话模型参数PLATOXL对话模型参数1亿8亿26亿94亿16亿110亿PLATO-12019 OctDialoGPT2019 NovMeena2020 JanBlender2020 AprPLATO-22020 JunPLATO-XL2020 SepUNIT 7.0 背后的核心技术17UNIT 7.0 所支持的百度最新 PLATO-XL 模型,是全球首个百亿级参数对话预训练生成模型,在开放
34、域对话的知识性与逻辑性方面,相对之前有了大幅提升,以接近真人的聊天能力达到全球领先水平,为用户带来更好的对话体验。在 DSTC-9 和 DSTC-10 两届领域顶级赛事中,百度 PLATO 共斩获十余项冠军,涉及任务式对话、开放域对话、领域知识对话等多个赛道。此外,百度 PLATO 已经取得了比较广泛的应用,比如支持虚拟助理数字人度晓晓、小度智能音箱上的开放领域对话能力。同时,百度也向领域内重要合作伙伴以虚拟助手的形式输出 PLATO 对话能力。而在 B 端应用场景中,百度已基本完成 PLATO 开发套件的研发工作,可以让企业级客户使用相对少量业务相关数据,就能打造自定义的开放域对话机器人。以
35、正向引导为目标的共情聊天任务对于对话机器人来说,如何做好用户的意图与情绪识别,是保证人机交互效果的关键。当下,业界在意图识别方面已达到相对优质水平,但对于情绪的理解与判断仍是难点,那么百度如何解决该问题呢?面向对话的情绪识别,尤其是在智能客服系统的实际应用中,业界还普遍停留在对负向情绪的安抚等简单场景。因此,面对人类情绪,在人机对话过程中产生更强的共情答复,是值得进一步探索的。针对该问题,百度在业界首次提出以正向引导为目标的共情聊天任务,并全球首次针对该任务构建和发布了百万量级数据集。通过在学习目标上引入情感损失目标,使得机器回复情感和用户初始负向情感差异逐步拉大,并实现多轮渐进式情感聊天模型
36、。该项技术对于情绪特征的深层次利用,有着重要示范意义。在不经过特定优化下,对话系统对于负面情绪往往倾向于做安全回答,整体敷衍性明显,甚至还会进一步刺激用户情绪。举例来说,如果用户与机器人说自己失恋了,情商不高的机器人会回复“不就失恋了吗,多大点事儿”;而具备共情能力的机器人,则能积极给予引导和安慰,从而回复“过段日子就好了,爱你的人还会来”,并通过类似语境的多轮对话,将用户情绪向正向引导。快速领域迁移UNIT 7.0 依托大数据与大模型的技术底座支持,以及百度在各行业、领域的落地经验,在快速领域迁移方面具备竞争优势。UNIT 7.0 通过百度 PLATO 和文心 ERNIE 大模型,打造预训练
37、模型底座,持续提升通用语义理解与生成能力,以及常识性知识运用能力。在此基础上,百度还研发了小样本学习、行业预置模型等快速领域迁移方案,让用户以更少的训练数据达到合格的行业场景对话效果。这其中,小样本学习技术,可以基于每意图数十级别样本,达到可初步投产的对话效果。对标现有生产系统同等对话效果,所需数据量降低 50%以上。同时,基于针对任务式对话定向设计的模型蒸馏任务,模型在算力开销上与传统的深度神经网络(DNN)模型持平。“云智一体”技术与应用解析系列白皮书 【智能对话篇】183.2 智能语音技术对话式 AI 技术被寄予厚望,其中一个核心方向就是大幅提升用户体验,而这与智能语音技术息息相关。对于
38、百度智能对话平台 UNIT 7.0 来说,智能语音技术主要包括语音识别与语音生成。3.2.1 智能语音技术的挑战在多场景的快速规模化落地上,语音识别技术面临的挑战有:用户来自不同地域,各种口音,训练语料极其有限;对识别准确率、响应时延等要求越来越高,以实现更好的用户体验;不同行业、领域的术语差异非常大。为了解决以上挑战,百度通过方言大一统模型、新一代 SMLTA2 流式端到端建模、语料自动化处理等全新技术,高效解决了以上问题,综合实现了多方言、高精度、低延时的语音识别效果。语音合成技术也面临着众多挑战:企业级用户对定制化、个性化合成音库的需求越来越高;用户期望在开放场景下,实现语音合成效果的稳
39、定、流畅;用户可用于训练的数据少,但期望训练周期更短。(图3.2.1-1 对话式AI企业级应用对语音识别技术的需求)对话式AI企业级应用对语音识别技术的需求用户分布广口音重语料少持续提升的用户体验要求识别精度、延迟直接影响用户体验领域差异大行业分布广领域垂直度高方言大一统模型一个模型支持多种方言且性能突出新一代SMLTA2流式端到端建模 大模型、高精度、低延时语料自动化处理语料自动挖掘和合成系统中国联通智慧客服系统一个模型支持31省(含重口音/方言)整体识别率超90%月承接话务近5000万通UNIT 7.0 背后的核心技术19对话式AI企业级应用对语音合成技术的需求依赖数据少少量数据训练不稳定
40、音色要求高少量数据训练模型的音色一致性差训练周期短从录制到训练、部署上线周期长细粒度声学建模细粒度精细声学建模基于大规模基础数据确保效果稳定可控自回归建模自回归建模提升风格预测能力平衡训练数据全流程自动化预训练与模型精调结合全自动数据处理,降低成本小数据量定制声学模型数据扩增数据扩增200句定制语料基础语料 成本低:录制音频数量 从数千上万句降低至200句 周期短:录制音频周期 从周级别降低至小时级 效果好:效果媲美 上万句训练效果 句准99.5%,ABX(效果对比性测试)可达 45:55面对以上挑战,百度通过细粒度声学建模确保效果稳定可控,通过自回归建模提升风格预测能力,通过训练全流程自动化
41、降低成本,满足用户目标。当前只需要人工录制 200 句音频语料,就可以生成一个可以媲美上万句语料的音库效果;音频录制时间也从周级缩短到小时级;还可提供快速定制化功能,比如在百度地图实践中,导航场景已实现 9 句话即可生成个性化音库的大规模应用。3.2.2 SMLTA 2 语音识别模型在深度学习时代,语音识别技术发展中出现了端到端的学习趋势。百度端到端语音识别技术,最大不同点在于,百度始终坚持服务于客户,客户对语音识别的需求是流式的、低延迟的。为了满足客户实际需求,百度打造了一种流式、多级、截断的识别模型-SMLTA,识别准确率大幅提升,同时具备跨领域快速扩展能力。第一代 SMLTA 于 201
42、9 年发布,是全球首款上线的流式端到端语音识别模型。(图3.2.1-2 对话式AI企业级应用对语音合成技术的需求)最新发布的 SMLTA 2,采用建模能力更强大的 TRANSFORMER 神经网络结构,替代原 LSTM 长短期神经网络,使建模上有更多优势:预训练数据量倍增。传统的语音识别数据信息比较稠密,一句话可能有上千帧,用传统建模方法,效率较低;使用 TRANSFORMER 结构后,可以让训练数据量增大一个量级。建模能力显著提升。根据百度内测,SMLTA 2 的流式语音识别效果可以媲美效果最好的非流式识别,相差在 5%以内。SMLTA 2 对于企业级用户来说,最大的提升是在扩展到多个商用场
43、景时,识别率依然保持高水平,甚至可以说,SMLTA 2 一套模型可以支持多个识别场景,企业的多个场景如客服、营销及外呼等,一个模型全搞定。3.2.3 方言大一统模型中国语言广博,各地都有方言和口音,而且各地说话方式和语速也都不尽相同。在方言识别领域,业界最普遍的做法,是针对每个地区配置专属模型,比如分别为河南、云南、湖北等地区配不同模型,但这样做对企业级用户不够友好,维护成本极高,在国内统一大市场的背景下,更是不妥。百度的方言大一统模型,相比于其他方言模型,可以做到一个模型搞定所有方言。除了所有数据混合训练外,百度还在模型结构、模型调优、输出单元、输出特征等方面实现了创新。在联通智能客服中心案
44、例中,百度基于 1 个模型就支撑起联通 31 省的重口音及方言问题,极大降低了部署和运维成本。“云智一体”技术与应用解析系列白皮书 【智能对话篇】2021智能对话场景化产品与方案智能对话场景化产品与方案“云智一体”技术与应用解析系列白皮书 【智能对话篇】224.1 企业对客服务的演变趋势随着技术发展和疫情影响,客户服务模式也在发生转变,一是业务办理的线上化趋势明显,二是服务触点的富媒体化。企业业务模式的变化,带动了对智能对话平台的需求变化:一方面是从人机对话降成本与辅助人工提效率,逐渐发展到服务全流程的人机相互协作;另一方面是从被动解决到主动触达,从问题解决到商业增长。与此同时,对客服务的应用
45、场景也在发生演变:服务营销进入精细化运营阶段,企业由原来的对客服务降本增效,延伸到基于数据洞察挖掘业务价值;同时,智能对话的客服场景延伸到企业经营、办公全流程等企业内部应用,助力企业提升经营质量和工作效率。(图4.1-1企业对客服务的业务演变)企业对客服务的业务演变与发展趋势业务模式演变平台需求演变应用场景演变线下业务线上化逐步开放线下办理业务的线上化,在线完成的业务占比迅速攀升服务触点富媒体化文字、电话的沟通渠道,已逐渐发展为全渠道、全媒体的服务模式,覆盖5G VoLTE、大屏等智能硬件等新渠道,视频化、数字人等多模态交互趋势凸现替代与辅助结合的人机协同从人机对话降成本与辅助人工提效率,形成
46、服务全流程中的人机相互协作从服务场景转向服务营销融合从被动解决到主动触达,从问题解决到商业增长,全流程应用智能对话形成端到端的解决方案服务营销进入精细化运营阶段企业由原来的对客服务中的降本增效,扩展到通过数据洞察挖掘业务价值应用场景延伸至企业内部应用将智能对话用于客服场景提升体验,延伸到企业经营、办公的全流程,为各环节提升经营质量,提升工作效率企业对客服务与需求场景发生变化,那么基于智能对话平台的产品矩阵,也要适时调整,让企业可以通过应用智能对话平台,来替代人完成重复性、规则性任务,辅助人工提升运营效率,达到人机协作的良性循环。基于智能对话平台 UNIT 7.0,百度智能云推出了全场景覆盖、多
47、模态的智能客服产品方案体系,满足企业对客服务的各类需求。智能对话场景化产品与方案23全新发布智能视频客服,提升远程业务办理效率和服务体验4.2 三大产品应用4.2.1 智能视频客服基于实时音视频能力,结合智能交互、生物特征识别、数字人等 AI 能力,智能视频客服为用户提供远程视频办理业务能力,助力企业提升客户体验和服务效率,降低企业成本。智能视频客服具有 AI 自助服务、可视化编排、坐席辅助、协同管理、合规管理和多终端接入等全面功能,可以应用到远程银行、保险展业与保全等服务营销场景中。百度智能视频客服有两大特点:一是可提供 ASR、OCR、身份识别、图像处理等 AI 全栈能力,为业务办理提升效
48、率;二是将数字人与智能对话平台深度融合,实现业务自助咨询与处理、重复性办理等。(图4.2.1-1 智能视频客服,提升远程业务办理效率)AI自助服务可视化编排坐席辅助协同管理合规管理多终端接入 多轮对话 数字人交互 业务交互 组件自定义 可视化编排 低代码开发 流程指引 数字人驱动 虚拟背景 表单协同 屏幕共享 白板画笔 录音录像 生物特征识别 动作识别 智能硬件 APP,小程序 5G电话机器人服务人工服务智能路由组件管理(AI、硬件、业务)实时音视频能力接入(低延迟、高性能、高安全性)智能对话业务流程编排录音录像助手配置监控报表系统配置流程指引数字人驱动屏幕共享表单协同硬件控制虚拟背景PC硬件
49、APP小程序手机客户管理员语音视觉NLP硬件管理业务接口ASRTTS人脸对比OCR语义实体读卡器高拍仪联网核查交易认证坐席VoLTE信道音视频ATC数据“云智一体”技术与应用解析系列白皮书 【智能对话篇】244.2.2 智能培训智能培训面向坐席和客户经理提供智能对练服务,为学员提供仿真客户练习、考试、智能辅导等能力,提升学员成长速度。具备人机交互、仿真模拟、多维度测评、可视化设计、课程个性推荐、多终端接入等功能。产品可应用于呼叫中心坐席培训、客户经理或保险专员等岗前培训,通过个性考题推荐与智能判题,提升培训效率。百度智能培训将 ASR、对话、数字人等融合到培训流程中,提高培训和学习的效果,缩短
50、岗前培训周期。(图4.2.2-1 智能培训,助力岗前岗中的学练考)全新发布智能培训,助力岗前岗中的学、练、考人机交互仿真模拟多维度测评可视化设计智能辅导多终端支持 多轮对话 题库抽取 多种交互方式 客户属性 标签画像 音色、数字人形象 语音测评 NLP测评 视觉测评 可视化流程 Excel导入 录音文件导入 学员短板分析 课程个性推荐 学员提升方案 APP PC H5讲师/组长公司培训部业务目标人员梳理知识梳理课程制作智能辅导掌握情况培训情况模型优化练习学习考试学员培训规划培训执行持续优化制定课程组织计划辅导员工过程优化培训规划结果评估培训任务过程反馈智能对话场景化产品与方案25全新发布智能客