1、出品机构:甲子光年智库报告指导:宋涛报告撰写:刘瑶发布时间:2023.04群内每日免费分享5份+最新资料 群内每日免费分享5份+最新资料 300T网盘资源+4040万份行业报告为您的创业、职场、商业、投资、亲子、网赚、艺术、健身、心理、个人成长 全面赋能!添加微信,备注“入群”立刻免费领取 立刻免费领取 200套知识地图+最新研报收钱文案、增长黑客、产品运营、品牌企划、营销战略、办公软件、会计财务、广告设计、摄影修图、视频剪辑、直播带货、电商运营、投资理财、汽车房产、餐饮烹饪、职场经验、演讲口才、风水命理、心理思维、恋爱情趣、美妆护肤、健身瘦身、格斗搏击、漫画手绘、声乐训练、自媒体打造、效率软
2、件工具、游戏影音扫码先加好友,以备不时之需扫码先加好友,以备不时之需行业报告/思维导图/电子书/资讯情报行业报告/思维导图/电子书/资讯情报致终身学习者社群致终身学习者社群关注公众号获取更多资料关注公众号获取更多资料前言不可否认AIGC的出现似乎已经让大家预见了AI应用的拐点,其创造性与智能性一夜之间刷新了大众认知。但去伪存真,在市场火爆的背后其真正的应用及商业价值几何,更待我们冷静地剖析。基于此,甲子光年智库特此展开AIGC应用与实践研究,输出AIGC应用与实践研究报告,期待与各方共同见证AIGC行业的星辰大海。AIGCAIGC如何从内容生成撬动作业模式改变本次报告探讨的问题去伪存真,研判A
3、IGC在引发热烈讨论背后的商业价值,尤其是围绕内容作业体系下的革新。1.AIGC的本质剖析及AIGC背后的新一代人工智能技术革新?2.基于技术及商业的价值,AIGC将会如何改变内容产业的作业模式,对现有商业模式带来哪些机遇及冲击?3.当下AIGC产业链及核心玩家可能是谁,如何在细分领域完成产品及服务?4.AIGC时代到来,企业及个人需要如何面对?AIGCAIGC时代已来,算力及数据下训练的“暴力美学”实现内容生成质的突破内容生成的低成本及高效率必然会冲击现有的商业模式AIAI企业、互联网企业、垂直行业的数字化科技企业在AIAI能力加持下需要再出发目 录Part 01概念重生:AIGC是内容生成
4、方式一次进化Part 02行业颠覆:内容生产体系的作业模式走向工程化Part 03产业变革:五湖四海涌向AIGC开阔地Part 04未来可期:在探索中寻找人类与机器的平衡缘起于GC,而归于AI,AIGC的关键是AI突破了人类生产“内容”的特权AIGC广义的概念:更关注如何利用生成式AI技术在涉及数字内容的诸多领域实现改变及突破:首先对内容的作业模式进行了流程再造其次对内容质量及成本的改变,改变了交互的效果及效率生成式AI实际上扩大了“内容”的含义,凡是可以数字化的内容形式均为生成对象,而非传统意义下媒体环境的内容狭义的概念:关注内容(Generated Content)的生成方式,即是否内容的
5、最终形态由AI完成,来自于互联网之前对内容生成方式描述比较(PGC&UGC),对生成主体的不同(人VS机器)、数量及规模的上限,生成速度的巨大差异进行比较目前广受热议的“AIGC”实际是对此次AI技术变革的一种描述概念,即AI(或者说以硅为基本构成的计算机)具备了人类社会中“内容生成概念”的能力,而不是随意生成人类社会共识下无法理解的文字语句、图片、人像、视频等等。AIGC概念具备狭义和广义区别,狭义概念更强调内容属性,广义概念强调AI的技术属性:狭义的概念重点关注的是数字内容的生产形式(Synthetic Media),和人类生成内容方式对比,例如文字、图片、视频等常规内容形式如何一步通过A
6、I生产;广义的概念则突出生成式AI(Generative AI)的概念,即如何通过生成式AI的技术思路解决以往决策式AI难以完成的问题,尤其在数据或者内容生成上实现“质的突破”。随着生成式对抗网络(Generative Adversarial Network,GAN)等的演进及迭代,生成式AI可以延展到流程、策略、代码、蛋白质结构等多种形式,即意味着凡是可以使用数字内容形式的产业,生成式AI均可以涉及。此次报告在广义的概念下进行讨论。分析式AIAI生成式AIAI通过对输入数据进行分析和推理,实现感知、认知及决策从大量数据中学习并生成新的数据或内容改变了人类社会所有判断相关的工作流程即将改变人类
7、社会所有内容相关的工作方式PGCUGCAI-UGCProfessionally-Generated Content内容生成成本高,需要专业人士完成内容生成,总体内容生产数量低User-Generated Content内容生成及传播成本由于互联网时代的,无需专业人士完成,总体内容生产数量有所提升AI-assisted-Generated Content内容生产主体从人类本身开始向人工智能迁移,主要区别体现在内容的生产效率、知识图谱的多样性以及提供更加动态且可交互的内容上注:此处表示的整个AI技术的大致方向AIGC提供了机器“从无到有”媒体内容生成能力分级0级1级2级3级4级5级发展趋势内容生产
8、模式生产人生产内容机器辅助审核机器辅助加工机器有条件自动生产内容机器高强度生产内容 机器完全自动生产内容生产主体采集生产人生产人生产人生产人和机器生产人和机器机器AI渗透率加工生产人生产人生产人和机器生产人和机器机器机器审核生产人生产人和机器生产人和机器机器机器机器机器生产力的限制情况采集受限受限受限部分受限部分受限不受限生产力加工受限受限部分受限部分受限不受限不受限审核受限部分受限部分受限不受限不受限不受限技术示例 素材上传、存储、分类、检索、权限设置 多媒体内容编辑,提供文字、图片、视频功能 内容在线批注、修改 支持内容审核,包括文字规范性核查,人物/机构/地域等实体属性核查 自动标题、自
9、动摘要、智能字幕、文本生成 在内容审核过程中自动屏蔽、剔除或修改内容 抓取线上数据 根据内容模板利用线上数据自动生成内容 采集素材的规范性与准确性审核 支持固定位置的线下设备进行数据采集 支持根据已设定的内容模板对原始数据进行加工后自动生成内容 支持可移动设备自动进行数据采集 分析原始数据,自动判断是否需要进一步采集,并根据素材挑选模板自动生成内容技术能力如果完全按照AI技术参与内容生产流程判断,大多数情况下是AI作为辅助完成内容的生产,但由于内容生产流程的复杂性,往往生成式AI参与的内容生产环节往往被称为“AIGC”从内容生产的流程看,内容生产粗略地由“采集”、“加工”、“审核”三个步骤组成
10、,这三个步骤以线性的方式逐步推进,最终完成内容的生产。AIGC技术使得机器可以在内容生产过程中尽量实现“自动化”,减少人的工作量;AIGC技术进步使得机器越来越走向“自动化”,实现了“从无到有”。完全态“AIGC”AIGC发展历程的拐点体现在媒体内容生成效果“质的突破”AIGC的技术不是2022年才突然出现,而是随着AI技术迭代而出现,早期主要是受制于算法、算力及信息数字化的程度(数据信息的成本)。随着机器智能的规模效应,及社会对于信息化的使用程度大规模上升(大量线上数据产生),AIGC迎来了发展的机遇,并且在2022年产品和服务效果在商业化规模效应下表现受到关注。1950s-1990s 19
11、90s-2010s 2010s-2021 2022至今早期萌芽阶段沉淀积累阶段快速发展阶段产品爆发阶段受限于科技水平,AIGC仅限于小范围实验AIGC从实验性向实用性转变,受限于算法瓶颈,无法直接进行内容生成深度学习算法不断迭代,人工智能生成内容百花齐放,效果逐渐逼真直至人类难以分辨 1950年,艾伦图灵提出著名的“图灵测试”,给出判定机器是否具有“智能”的试验方法 1957年,第一支由计算机创作的弦乐四重奏依利亚克组曲(llliacSuite)完成.80年代中期,IBM创造语音控制打字机Tangora 2007年,世界第一部完全由人工智能创作的小说1 The Road问世 2012年,微软展
12、示全自动同声传译系统,可将英文演讲者的内容自动翻译成中文语音 2017年,微软“小冰”推出世界首部100%由人工智能创作的诗集阳光失了玻璃窗 2018年,人工智能生成的画作在佳士得拍卖行以43.25万美元成交,成为首个出售的人工智能艺术品 2019年,DeepMind发布DVD-GAN模型用以生成连续视频 2021年,OpenAI推出了DALL-E,主要应用于文本与图像交互生成内容迎来集中爆发,多款产品出圈 2022年8月Stability AI发布的Stable Diffusion模型。2022年11月30日推出的人工智能聊天工具ChatGPT 该阶段:从技术角度上,持续进行尝试,实现算法在
13、局部领域的突破,但是受制于算力、能耗及基础设施的不足,未能实现实际生成中的“生成”效果,如训练计算的增长符合摩尔定律,大约每20个月翻一番。更好的模型,更多的数据,更多的算力生成式AI迎来了更好的发展土壤自2010年代早期深度学习(Deep Learning)问世以来,训练计算的规模加快,大约每6个月翻一番。2015年末,随着公司开发大规模ML模型,训练计算需求增加10至100倍。2015-2016年左右,出现了大规模模型的新趋势。这一新趋势始于2015年末的AlphaGo,并持续至今AIGC在内容层面产生的效果源于“基础模型”可以广泛使用递归神经网络(RNN)蒙特卡洛树搜索(MCTS)卷积神
14、经网络(CNN)受限玻尔兹曼机(RBM)Paul Smolensky多层感知机(MLP)反向传播(BP)概率模型高维词向量长短期记忆(LSTM)非线性激活深度玻尔兹曼机(DBM)生成对抗网络(GAN注意力机制(Attention)RNN改进AlexNet&Dropout深度强化学习(DQN)Attention&Transformer生成预训练变压器(GPT)双向编码表示(BERT)GPT3残差网络(ResNet)AlphaFold2AlphaFoldchatGPT(GPT3.5)MT-NLG代表具有里程碑的关键创新代表相关算法开创者所在公司或阵营1900年-1980年1980年-1990年19
15、90年-2000年2000年-2010年2010-2020年2020年-至今Transformer的应用标志着基础模型时代的开始(基础模型的庞大规模和应用范围突飞猛进)技术层面上,基础模型通过迁移学习(Transfer Learning)和规模(scale)得以实现 深度学习中,预训练又是迁移学习的主要方法:在替代任务上训练模型(通常只是达到目的的一种手段),然后通过微调来适应感兴趣的下游任务。迁移学习(Transfer Learning)使基础模型成为可能人工智能基于漫长的研究过程,正在经历范式上的转变:基于通用类模型构建人工智能(AI)系统,这种模型则被称为基础模型,即在大规模数据上训练并
16、适配(微调,fine tune)到各种下游任务的模型。从技术角度来看,基础模型并不新鲜:它们基于深度神经网络和自监督学习,两者都已经存在了几十年数字内容的孪生能力将现实物理世界中数字世界复刻一遍数字内容的智能创作高效生成人类可以理解的数字内容数字内容的智能编辑将数字世界的化身数据进行修改编辑AIGC产业的发展来自于算法、数据及算力的综合推动AIGC数据数据巨量化跨模态融合算法算力内容创造力数据层面核心技术突破多模态认知计算数字孪生虚拟现实全息立体应用场景算法层面感知+交互大数据语料库高精度训练集标注训练计算任务投喂算力层面硬件算力智能交互实时算力边缘计算云计算本地化 从现实生成数字:AIGC利
17、用AI技术构建模拟现实世界的数字孪生模型;从数字生成数字:AI能够学习并创作更丰富的内容;从数字生成现实:AIGC基于物联网,多模态技术获取多维信息,实现更加智能的人与机器互动。当下的时代机遇:大规模模型的摩尔定律-单模型参数量每年增长1010倍AIGC面对的训练变化:训练所需的资源仅仅是成功的“必要不充分条件”算力设备:提供底层动力源泉收集数据及数据准备包括数据收集、预处理、存储;数据的质量和梳理对算法效果至关重要特征工程从原始数据提取有代表性、可解释的特征模型选择自开发实现模型使用现成的框架模型训练无监督学习监督学习强化学习模型评估根据分类、回归、聚类等各种问题有相应评估指标模型调优网络搜
18、索、随机搜索、贝叶斯优化、梯度优化、集成方法等选取最优参数组合,提高模型性能模型部署和应用模型封装后,导入生产环境进行推理模型调参API部署边缘部署集成部署批处理部署容器化部署调参过程实际上类似于“实验”:“调参”的结果与以往人工智能方式相比,具有更多的不确定性,需要进行多次的反复训练,模型训练中,模型即是训练结果,中间的过程则无法完全复制。算力规模数据质量数学理论分布式计算效率充足的能耗模型训练涉及的基础资源提升在方向上(理论上)能够决定模型训练的效率和结果实际上可以看作“必要不充分条件”:难以明确的直接因果关系训练的过程呈现“黑盒”性质“量变”撬动“质变”AIGC的产品商业落地需要在模型构
19、建与应用中寻找最优解“海洋之光”超级计算机(国产超算)512块 GPU大算力腾讯太极机器学习平台昇腾 AI 基础软硬件平台16 块 GPU大数据量1.9TB 图像292GB 文本中文多模态数据集 M6-Corpus五大跨模态视频检索数据集基于万条小规模数据集数百 G 级别不同领域的高质量语料模型类型多模态预训练模型图、文、音三模态“八卦炉”(脑级AI模型)M6大模型“混元”HunYuan_tvr紫东太初孟子大参数174万亿(与人脑中突触数量媲美)10 万亿万亿千亿10亿商汤AIDC,峰值算力3740Petaflops3-计算机视觉模型计算机视觉模型书生(INTERN+)某视觉模型100亿300
20、亿商汤科技商汤科技等企业清华大学等1阿里腾讯280 块 GPU鹏城云脑(2048 块CPU)和百度飞桨4095(Pflops-day)/2128 张GPU3390 亿条文本数据纯文本和知识图谱的4TB 语料库5000GB 高质量中文数据集NLP 大模型NLP 大模型NLP 大模型Megatron-TuringERNIW 3.0 Titan源 1.05300亿2600 亿2457 亿微软和英伟达百度和鹏程实验室浪潮信息鹏城云脑和全场景 AI 计算框架MindSpore,2048 块 GPU40TB 训练数据盘古系列大模型千亿3640(Pflops-day3)/上万块V100 GPU 组成 gao
21、 带宽集群算力超过万亿单词的人类语言数据集GPT3.51750 亿OpenAI华为云中科院自动化所澜舟多模态预训练模型结合人类参与强化学习复旦大学超算中心-对话式大型语言模型MOSS百亿复旦大学大模型小模型海量无标注数据:文本、图像、视频自监督学习利用更有限的资源形成实现具备应用的特征类似人类学习的“通识教育”通过“暴力美学”实现大算力、大数据、大参数下的通用模型能力,根据具体垂直应用进行fine-tune依然通过预训练模式实现基础模型,但关注具体垂直细分应用,最终模型相较于大模型的参数(千亿规模)少,更容易实现小算力场景下的应用营销游戏影视金融工业教育传媒生成文字生成图片生成视频生成代码生成
22、虚拟场景生成数字人生成策略技术能力行业应用类似人类学习的“专业教育”fine-tune基于应用调整模型最终形态基于模型寻找最优的应用落地目 录Part 01概念重生:AIGC是内容生成方式一次进化Part 02行业颠覆:内容生产体系的作业模式走向工程化Part 03产业变革:五湖四海涌向AIGC开阔地Part 04未来可期:在探索中寻找人类与机器的平衡AIGC内容的生成作业方式基于人类的“prompt”而完成AIGCAIGC预训练模型串联融通2014年提出,由生成器网络和判别器网络组成,相互对抗,不断提高生成样本真实性和判别器准确性CLIP(对比性语言-图像预训练)模型是,可以理解文本和图像。
23、该模型将文本和图像匹配起来,可识别图像中的内容和描述图像的语言Transformer模型取代了RNN,Transformer 模型能够同时并行进行数据计算和模型训练,训练时长更短,且训练得出的模型具有可解释性相较于GAN,是图像生成领域的一大进步,不需要明确地计算数据的先验概率分布。通过“扩散”来执行隐空间中的推断2020年提出,NeRF 能够将2D图像转3D模型,可以利用少数几张静态图像生成多视角的逼真3D图像GANCLIPTransformerNERFDiffusion特殊文本形态代码(-计算机语言)生物/化学信息(蛋白质序列、碱基序列)特殊视频形态示例3D视频(数字世界的立体形态)动画(
24、与写实类视频做区分)数字人(目的为模拟人的视频形象)动态环境(一般指数字场景)文本图片音频视频策略/选择(数字世界的行为及交互)文本图片音频视频策略/选择(数字世界的行为及交互)人类可执行的内容输入(prompt)输出人类可以理解的内容形态(next token)内容生成的原理思路示例,以下算法结构是目前较为常用的结构,当下的预训练模型向着可以使用更多种类“prompt”的方向发展,以满足作业需求内容生成的核心在于使用人类文明常用的表达方式进行,利用计算机实现内容形态的输出,文本作为prompt是最容易使用,也是目前最容易实现的方式*代码生成其他内容,则是通过计算机语言完成,往往不需要生成式A
25、I技术*机器也可以设计为不需要prompt完成,但不在内容生产作业体系范畴下,本报告不做讨论AIGC的技术内核推动内容生产方式从“作坊式”走向“流水线”工作流程及范式发生改变各类内容形态的生产时间大幅降低基于内容的交流效率大幅提升直接价值:内容的生成成本下降,生成效果提升间接价值:人与人之间,人与机器之间的交互效率提高最终价值:生产力显著提升,生产关系逐步发生变化内容交互流程AIGC不仅改变了内容生产的方式,从内容-交互-流程,实现了生产方式的变革。AIGC解决了内容创作效率的核心矛盾:环节中始终存在大量个性化的重复性工作,内容创作的门槛及成本皆源于此。AIGC可以在部分环节实现“工程化”的工
26、作模式AIGC解决了工作过程中交流的核心矛盾:交互环节中面对文字风格、图片、视频等等无法用语言进行准确描述的环节,都可以采用快速生成的内容进行直接沟通,颠覆了沟通方式AIGC重构了作业环节的劳动力(生产时间变化所致)与物质资料(能耗、技术等)分配:生产力的发展会促使新的生产关系的出现AIGC的能力来源于内容生成的多种类型,辐射多个应用场景及行业文字生成音频生成图像生成虚拟生成策略生成代码生成营销游戏影视金融工业传媒教育视频生成蛋白质结构生成文本处理:总结、续写、改写、修改文本交互:闲聊、问答、咨询音乐生成人声生成、语音克隆图像编辑、修复、风格转换2D图像生成、3D图像生成(AI绘画)图像分析视
27、频修复、风格转换视频特效(换脸、造景)数字人生成音效生成游戏场景生成对战策略NPC“心智”(与环境的交互)代码按需生成或补全修复代码bug蛋白质结构预测游戏逻辑及剧情心理法律医疗文字素材的生成及加工:小说、稿件、剧本、文案、新闻资讯、广告语基于文字内容的分析:策划、思路灵感激发、热点捕捉基于专业内容的交互:客户服务、心理咨询、法律咨询、医疗咨询、金融咨询、教育咨询基于娱乐的交互:游戏对话、闲聊互动、文字游戏基于商业服务的图片设计及修复:广告海报、工业设计图、建筑图、服装设计、CAD图图片素材的生成、影片的特效及转制长视频、短视频的生成、修复、转换基于商业化的音乐制作:编曲、歌曲制作变声及配音数
28、字形象的建立/模拟:游戏NPC、虚拟偶像、虚拟IP、数字员工(咨询师、分析师、老师、医生、律师)数字场景的建立:游戏场景、影视特效、数字孪生场景、地图生成关卡、剧情、对战的生成、改编代码编写、信息系统应用的开发专业领域的数据分析、报告生成数字形象直播科研思路及灵感的激活生成的内容类型内容形式应用的场景覆盖行业实现规模化生产下的个性化应用从内容到流程,AIGC实现游戏行业作业模式的加速变化探索阶段原型阶段开发阶段测试阶段上线阶段游戏开发市场分析产品核心成本、周期预估竞争分析方案策划技术确定美术、音乐原型程序代码编写美术设计音效制作测试BUG修复数据监控紧急情况处理策划美术素材音乐和音效对战策略图
29、像、文本素材生成原画设定(2D)3D游戏3D角色3D场景和物体3D角色模型3D角色动作3D角色表情3D技能特效Photo-to-3DText-to-3DGPTCodeDCC3DScan(Laser+Photos)2D游戏2D角色2D场景和物体3D角色表情3D技能特效2D角色动作2D角色设计代码逻辑游戏的内容生成效率及效果提升赋能游戏开发全流程游戏的开发过程涉及了AIGC内容生成的诸多方向,以游戏为例,可以体现AIGC相关内容的生成效率及效果直接加速了整个开发流程。*其中部分内容生成的成熟度尚且不足智能客服实现更自然和专业的交互实现对消费者“心智”层面理解内容营销基于数据实现个性化交互数字人等更
30、多营销模式的普及智能电视开屏广告信息流广告插入式广告贴片广告搜索广告线上广告淘宝京东拼多多垂直/兴趣电商平台平台粉丝群拼团群电商平台小红书微博知乎豆瓣社交类B站抖音快手影视综艺视频类淘宝直播抖音直播快手直播电竞游戏直播直播平台楼宇广告门店商场户外广告OTT大屏微信公众号微信视频号企业微信群微信小程序导购个人微信微博企业号知乎企业号抖音企业号企业号矩阵自有APP自有官网自有粉丝群自有平台消费者“心智”面对全渠道的同质化内容饱和式地争夺AIGC推动了营销过程中交互对于用户心智的理解作用,重构商业逻辑行动触达兴趣分享用户属性用户订单行为用户偏好用户分层商圈细分风险控制社交属性以新一代消费者的生命周期
31、为例,内容营销与交互可以影响全周期通过内容的生成,AIGC通过交互方式的升级实现企业与消费者间壁垒的“打穿”AIGC对于企业和消费者间的交互方式改变标签化的数据(营销全链路信息)与内容营销的结合可以实现更多的玩法创新ID身份数据来源数据用户主数据会员数据第一方数据第二方数据第三方数据分层数据标签数据偏好数据指标数据行为数据订单数据标签数据模型数据情感状态数据外部标签数据“知识传递和生命传递将重构世界的商业模式。在未来,并非AI战胜人类,而是使用AI的人群会打败没使用AI的人群。硅基智能创始人&CEO 司马华鹏”AIGC给予了企业流程的新的管理思路及技术可行性供应商客户生产部门财务采购及销售物物
32、财财资资企业内部供应商一级供应商二级供应商企业分公司/子公司各地办事处用户to B/to C客户KA客户/小客户原材料核心/非核心材料物流产品/货物生产过程产品废料商品SKU管理价格管理应付账款流程审批网银转账应收账款流程审批网银转账内部费用工资及奖金绩效奖金采购原料管理采购流程销售售前/售中/售后营销模式生产/货物调配生产调度存货管理人物资财产品营销自动补货销售信息产品组合仓储管理加工订单生产工艺供应采购AIGC可以通过模拟学习和模型构建,帮助企业更好地理解大数据,提升企业的智能化水平,实现智能化运营,从而提升企业的效率和能力AIGC可以改变以往企业各个环节的依赖内容(非机构化数据)交互流程
33、及效率,实现部门与部门间、部门内容之间的沟通更为顺畅数据在企业的人、财、物、资中无处不在,数字化的重要作用是通过数字世界的信息流完成企业数字化管理既定业务流程的建模、标准化、自动化、执行、控制、度量和优化(例如BPM)是基于现有数据交互协同的思路管理员工;AIGC通过解决部分交互及协同标准,可以更好地实现流程上的协同管理,但仍需企业对场景的不断探索后才能明确需求。企业流程示例从内容出发,AIGC实现了AI技术对各个行业的升级迭代,带动产业价值AIGC在内容成本的替代比率AIGC在流程交互中的提升比率营销游戏影视金融工业传媒教育心理法律医疗AIGC在产业模式的创新比率AIGC实现对细分行业内容生
34、成而呈现的替代价值。例如,批量生成文案、图片、视频等,直接完成原有行业内容作业方式的方式替代,是AIGC价值的直接体现AIGC通过简化行业的流程交互过程,从而提升了原行业的效率,实现时间成本的保留。例如通过智能客服完成提升营销过程中的效率及最终达成AIGC通过内容生成的多样性,尤其是虚拟技术的应用(数字人、虚拟场景、3D建模等等),实现了行业内新的商业模式。例如通过快速构建数字员工实现数字劳动力的价值AIGC在原有产业规模上实现升级以部分产业数字化细分行业规模量级为示例,单位元2022年,中国数字营销市场规模数量级:10000亿2022年,中国网络视听规模数量级:3000亿2022年,中国游戏
35、市场规模量级:2600亿2022年,中国金融科技市场规模量级:5000亿2022年,中国线上市场规模量级:3000亿2022年,中国法律服务规模量级:1500亿2022年,中国线上问诊规模量级:500亿2022年,中国工业设计规模量级:5000亿2022年,中国心理咨询规模量级:3000亿*以上为示例,仅代表AIGC的产业带动规模计算逻辑AIGC可以带动的产业价值AIGC的行业商业化落地需要基于目标与资源的分配与达成的工程学方式技术实现行业know-how实现AIGC的商业化落地是考验企业在平衡模型开发成本与行业问题解决程度的能力,并且比以往更具有可调整性,因为AIGC对于问题的解决不是唯一解
36、,而是要与原有的数字化方案做成本的比较与衡量。算力及能耗的管理基于AIGCAIGC提供用户更好的商业解决方案AIGCAIGC的价值是基于行业knowknow-howhow的最优解回答,AIAI落地需要找到企业自身的适合的方式包括模型的开发成本及后续产品的运营成本行业know-how不仅仅表现在丰富的行业实践经历,而是深入理解客户的业务需求,并且通过管理项目开发的流程完成,在细化需求中寻找到主要矛盾并解决Why(用户分析)How(项目执行)基于用户的细分行业属性,熟悉细分行业的需求价值基于用户的业务流程细节,对用户的需求矛盾分析基于用户的资源能力,明确用户的负担上限在不同阶段和层面对项目的工作内
37、容从主项、分项、子项甚至单体的各个部分进行拆分(例如采用WBS),实现项目关键节点的管理,完成项目人员的协同、管理、分工及时间资源调配对风险的预知、判断及合理控制预训练模型基于需求进行fine-tune结合其他需求进行产品的封装对应数据准备技术实现路径模型的训练“黑盒”机制需要工程化的思索时间成本(是否尽快抢到实践化的落地)基础设施成本(云服务或者算力的使用成本)人员成本(工程化协作的团队)目 录Part 01概念重生:AIGC是内容生成方式一次进化Part 02行业颠覆:内容生产体系的作业模式走向工程化Part 03产业变革:五湖四海涌向AIGC开阔地Part 04未来可期:在探索中寻找人类
38、与机器的平衡AIGC在全球范围内引发投资热潮,巨大潜力驱使多行业企业进入企业名称融资时间融资轮次融资金额投资机构超参数2022-01B轮1亿美元五源资本,红杉资本中国,高榕资本影眸科技2022-04Pre-A轮数千万人民币奇绩创坛,红杉中国种子基金数字力场2022-07天使轮数千万人民币BV百度风投智谱AI2022-09B轮数亿人民币启明创投,君联资本特看2022-09天使轮数千万人民币未透露标贝科技2022-10B轮数千万人民币基石基金,联储证券中科闻歌2022-10E轮超5亿人民币国家制造业转型升级基金等心识宇宙2022-11天使+数千万人民币银杏谷资本,红杉中国种子基金等衔远科技2023
39、-01天使轮数亿元启明创投领投、经纬创投跟投深氧科技2023-02天使轮千万级人民币汉能创投tiamat2023-02A轮近千万美元DCM中国,绿洲资本澜舟科技2023-03Pre-A+轮数亿人民币中关村科学城,斯道资本,创新工场行者AI2023-03天使轮数千万人民币英诺天使基金,九合创投$71$199$1,296$271$1,548$2,654 23324265105110020406080100120140160$0$500$1,000$1,500$2,000$2,500$3,000201720182019202020212022全球来看,投资者对生成式AI的兴趣在2022年大幅上升投资
40、额 单位:百万美元投资数量OpenAI获10亿美元融资拉高数值中国企业也备受投资机构关注*以下企业为示例,代表AIGC的企业在2022年及2023年受到了投资者关注基于模型的IT技术栈更加复杂,也为企业进入AIGC产业提供更多玩法从模型到应用闭源闭源模型应用基于公共网络平台的应用,单一平台应用网络平台应用提供基于本地边缘或端侧交互的应用边缘或端侧应用数据中心工具与模型部署和调用API数据中心与模型API基于预训练模型的场景/产品适配Prompt优化与模型微调商业化的预训练模型,通过API调用非开源预训练模型开源模型共享平台模型Hub代码及权重开源的预训练模型,一般可免费试用开源模型用于训练或云
41、部署的深度学习框架和中间件等,包括PyTorch、TensorFlow深度学习框架与中间件等用于训练或云部署的开放式计算平台云计算本地边缘或端侧交互计算硬件边缘或端侧计算平台计算加速芯片与存储芯片,用于模型训练与部署包括:CPU、GPGPU、DSA(例如TPU)、内存、NVMe协议、Infinband网络解决方案等计算机硬件与芯片应用层中间层(接口层)模型层框架层资源层数据采集、清洗、标注等数据AIGC的IT技术栈通用类:提供大模型能力,实现MaaS(Model as a Service)解决模型的基础设施与训练条件,如算力、数据及网络资源;如训练所需的框架及平台等目前,垂直类企业及通用类在产
42、品及服务方式的建立过程中实现了中间层的任务,当下单独提供中间层能力企业较少对于用户来讲为垂直类企业:针对细分领域需求提供产品或服务芯片数据云服务训练目前是AIGC企业发展的最初阶段,企业在探索中寻找合适的场景进行商业化落地,往往跨越技术栈的多个层级实现商业试错AIGC产业图谱通用类:侧重NLP/CV/NLP/CV/音视频/多模态大模型能力尽量拓展大模型通用能力,提供的是跨越尽量多的模态、行业、场景能力的大模型(排名不分先后)芯片数据云服务借助生成式AI的模型、算法思路,利用工程化的手段加深纵向细分场景、行业、领域的应用效果,提供针对性的产品及服务(排名不分先后)垂直类:针对细分领域需求提供产品
43、或服务(包括to Bto B,to Cto C)训练综合(提供多类型产品/服务)虚拟技术(包括虚拟人及虚拟场景建设)游戏技术创新(包括美术、剧情及策略等)营销创新(营销方式创新或提效)效率工具写作图像设计代码AIGCAIGC产业图谱V1.0V1.0(未来有更多的企业进入AIGC领域或扩大自身的能力范围,并且AIGC会具有更多的细分场景)影视音创作(提升视频、音频生成效率)工业其他(教育等)重点厂商产品及服务能力分析百度具备从芯片层到应用层的AIGC完整产业能力,率先尝试应用大模型赋能多行业公司简介:百度是拥有强大互联网基础的领先AI公司。是全球为数不多的提供AI芯片、软件架构和应用程序等全栈A
44、I技术的公司之一,百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。芯片层框架层模型层应用层文心大模型百度是目前全球少有的,在“芯片-框架-模型-应用”四个层面上均有所布局的人工智能公司“芯片-框架-模型-应用”四个层面将形成高效的闭环反馈,推动百度人工智能持续迭代升级并且框架层和模型层之间具有协同作用,可以帮助构建更高效的模型,并显著降低成本。例如,为了支持海量参数模型的高效分布式训练,百度飞桨专门研发了4D混合并行技术实现千行百业的商业落地百度文心全景图产业级知识增强大模型拥有AIGC产业的优质生态,用AIGC技术实现数字
45、世界的建设与链接6.48亿月活用户量8亿网盘积累用户1.1亿全域DAU1300亿日均位置服务请求8000万全域DAU百度多端优势产品矩阵,打造10亿+互联网用户规模的“创新土壤”3000万家庭渗透AI驱动数字人AI驱动的3D生成AI实现的虚拟空间以数字人为例,提供行业级完整的解决方案为创作者打造更多的创作工具及环境具备实现完整虚拟世界的建设能力百度数字人:1+2+3+X虚拟数字人生态体系一站式平台数字人核心资产三大应用+三大场景3d数字人:度晓晓+希加加+EVA合作授权品牌营销服务场景百度智能云曦灵平台四大AI引擎为依托唇形驱动表情驱动肢体驱动手势感知人像驱动引擎智能对话引擎语音交互引擎智能推
46、荐引擎任务对话预置技术智能问答开放域对话全双工AST变声器个性化TTS定制唤醒词内容与产品推荐素材库国内首款独立元宇宙APPAI智能永久复用多端兼容极限观感丰富活动场景会议会展、文博文旅文创、试乘试驾、个人空间元宇宙基础设施百度文心产业知识增强大模型500万创作者文字生成图片生成音频生成视频生成百度AI开放平台AI能力实现AIGC千行百态的赋能,场景反馈的应用需求提升AI能力产品矩阵为AI的应用提供广泛土壤,AI反哺用户效率工具与创新能力为创作者提供AI生成工具,降低创作门槛,让更多普通人享受内容创作的快乐输入文案成片输入或粘贴一段文案生成视频选择文章成片从百家号文章中选择内容生成视频智能匹配
47、素材无需担心素材缺乏,海量内容快速成片模版一键包装丰富模版,标题、字幕、背景、配音,可以在模版中一键搞定2d数字人:青小霞+40位数字人上百套专业级模版,覆盖不同场景40+数字人音色,打造千人千面度咔口播TTV自动生产营销解决方案+重点厂商产品及服务能力分析硅基智能:国内AIGC赛道领跑者打造多种形态的“硅基劳动力”,科技平权赋能千行百业公司简介:硅基智能是创立于南京的人工智能独角兽企业,获得国家高新技术企业、国家级专精特新“小巨人”企业认证,也是腾讯在人工智能领域唯一重点投资的AIGC科技公司。硅基智能以人工智能科技创新为核心驱动力,将“碳基生命的硅基化”作为核心目标,专注于AI技术深度研发
48、和落地应用,布局AIGC领域不断研发,通过数字人+AIGC的创新应用生产场景,实现更接近于人类、个性化、善学习的数字人应用方案。目前硅基智能已投入服务10多个行业近万家企业,在本地生活、直播电商、医疗教育、泛娱乐、金融服务、文博文旅、政务服务等行业开辟了一系列AI数字人规模化应用场景,目标2025年为世界创造1亿硅基劳动力。人物形象克隆智能语音交互自然语言处理智能语音识别个性化TTS无穿戴表情动作捕捉OpenGPT大语言模型硅基DUIX引擎+华为鲲鹏引擎算法技术产品平台DUIX(数字人交互平台)MAAS(沉浸式AI体验平台)应用场景知识生产虚拟直播生命克隆数字文娱知识电商企业家IP名医律师IP
49、达人经济本地生活直播直播带货服务跨境电商服务中小企业直播数字永生情感陪伴名人复刻虚拟偶像数字人智能大屏数字文创DAAS(数字孪生应用平台)核心资源电力算力财力核心围绕“硅基劳动力”的建造及后续运营,对传统“生产资料”的需求进行重构,帮助更多企业释放自身的潜能基于自研的AI技术及平台打造,逐步实现“硅基劳动力”在诸多场景的价值释放,把人类从繁重的重复性脑力劳动中解放出来,让人回归人的价值,创造及实现自我生命价值的时间与空间,为人类世界的丰富性打造更多可能性2025年为世界创造1亿硅基劳动力,在实践中不断迭代“硅基劳动力”的实际场景价值英雄缅怀数字文旅电商直播带货本地生活直播带货硅基智能:数字人+
50、AIGC,大幅提高直播和视频生产效能能力认证:硅基智能的数字人通过中国信通院47项基础能力评测,成为拥有权威认证的数字人厂商之一。场景落地:数字人直播平台和硅语短视频平台,广泛应用于本地生活直播、电商直播带货、企业家IP、医生IP、律师IP、个人IP、直播电商、跨境电商等领域,适用抖音、快手、视频号、淘宝、天猫、拼多多、京东等国内视频、电商全平台,也支持海外视频平台如TikTok、Ins、Facebook、YouTube等。直播:一键打造“数字分身”,实现超高拟真度的数字人主播的快速生成短视频:实现微表情、肢体语言等多维度的突破,复刻数字化形象 数字人直播平台,全流程数字化,无需服化道、设备、