1、 敬请参阅末页重要声明及评级说明 证券研究报告 ChatGPT 引发的大模型时代变革 Table_IndNameRptType 计算机计算机 行业研究/深度报告 行业评级:增持行业评级:增持 报告日期:2023-02-25 行业指数与沪深行业指数与沪深 300 走势比较走势比较 分析师:尹沿技分析师:尹沿技 执业证书号:S0010520020001 电话:021-60958389 邮箱: 分析师:王奇珏分析师:王奇珏 执业证书号:S0010522060002 邮箱: 分析师:胡杨分析师:胡杨 执业证书号:S0010521090001 邮箱: 分析师:张天分析师:张天 执业证书号:S001052
2、0110002 邮箱: 分析师:金荣分析师:金荣 执业证书号:S0010521080002 邮箱: 相关报告相关报告 1.华安证券_公司研究_计算机行业_行业深度_华安证券 2023 年计算机推演:数字经济+_2022-12-12 2.华安证券_公司研究_计算机行业_行业深度_华安证券数字经济系列报告(一):科技赋能、新基建,数字经济大有可为_2022-03-09 主要观点:主要观点:ChatGPT 带来带来大模型时代变革大模型时代变革,数据要素重要性提升,数据要素重要性提升 ChatGPT 是由 OpenAI 研发的一种语言 AI 模型,其特点在于使用海量语料库来生成与人类相似的反应。初代
3、GPT 模型参数 1.17 亿,GPT2模型、GPT3 模型参数分别达到 15 亿、1750 亿。不断提升的参数量级,使得 ChatGPT3 当前已经能够应用在商业、研究和开发活动中在商业、研究和开发活动中。当前此类参数体量庞大的模型,成为各大科技厂商研发重点当前此类参数体量庞大的模型,成为各大科技厂商研发重点。大模型的。大模型的基础为高质量大数据。基础为高质量大数据。ChatGPT 的前身 GPT-3 就使用了 3,000 亿单词、超过 40T 的数据。此类大数据基础的前提为三部分 1)有效场景下的采集数据;2)大数据的存储、清洗和标注;3)数据质量检验。大模型发展之下,算力与网络设施大模型
4、发展之下,算力与网络设施建设建设成为成为刚需刚需 算力:算力:ChatGPT 类人工智能需要更充足的算力支持其处理数据,带来更多高性能的算力芯片需求。英伟达表示,GPT-3 需要 512 颗 V100 显卡训练 7 个月,或者 1024 颗 A100 芯片训练一个月。2012 年以来,AI 训练任务中的算力增长(所需算力每 3.5 月翻一倍)已经超越摩尔定律(晶体管数量每 18 月翻一倍)。网络设施:网络设施:以微软 Azure 为例,其 AI 基础设施由互联的英伟达 Ampere A100 Tensor Core GPU 组成,并由 Quantum infiniBand 交换机提供横向扩展能
5、力。服务器节点多、跨服务器通信需求巨大,网络带宽性能成为服务器节点多、跨服务器通信需求巨大,网络带宽性能成为GPU 集群系统的瓶颈,解决方式包括增加单节点通信带宽与降低网络收集群系统的瓶颈,解决方式包括增加单节点通信带宽与降低网络收敛比敛比,带来光模块、交换机等需求。带来光模块、交换机等需求。下游下游应用场景丰富,多行业落地可期应用场景丰富,多行业落地可期 1)“生成式 AI(generative AI)”在互联网及元宇宙领域市场化空间较为广阔。基于现行的 NLP 算法发展程度及数据集规模。在不久的将来,生成式 AI 有较大可能在“智能客服”和“搜索引擎”进行增值,并有希望以“插件”的形式赋能
6、现有的“生产力工具链(工程软件/音视频制作工具等)”。2)AI在制造业的应用可分为三方面:在制造业的应用可分为三方面:a)智能装备:)智能装备:指具有感知、分析、推理、决策、控制功能的制造装备,典型代表有工业机器人、协作机器人、数控机床等;b)智能工厂:)智能工厂:重点在于实现工厂的办公、管理及生产自动化,典型的代表场景有协作机器人、智能仓储物流系统等;c)智能)智能服务:服务:指个性化定制、远程运维及预测性维护等。3)人工智能在智能汽车领域的应用包括:a)智能驾驶依托 AI,将从驾驶辅助发展至自动驾驶;b)智能座舱在 AI 支持下,从出行工具演变为出行管家。风险提示风险提示 国内大模型不及预
7、期风险;行业竞争加剧风险;AI 应用的伦理道德风险;芯片及技术供应风险;商业模式变现与落地不及预期风险。Table_CompanyRptType 行业研究行业研究 敬请参阅末页重要声明及评级说明 2/80 证券研究报告 正文正文目录目录 1 引言引言.7 2 CHATGPT 引发人工智能投资热潮引发人工智能投资热潮.8 2.1 CHATGPT 是什么?.8 2.2 CHATGPT 技术和传统的 AI 有什么区别?.9 2.3 CHATGPT 将给行业带来哪些机会?.11 1)语音识别与自然语言处理行业快速发展:.11 2)激活产业链:.12 3 数据要素资源基础,满足大模型训练需求数据要素资源
8、基础,满足大模型训练需求.13 3.1 政策引导数据要素确权使用,扫清人工智能发展障碍.13 3.2 大数据管理能力需求提升.14 3.3 数据标注,是 AI 模型的基础.16 3.4 相关标的.18 1)星环科技:平台、数据库集一身的数据要素稀缺标的.18 2)海天瑞声:人工智能基础数据服务提供商,产品矩阵不断丰富.21 4 CHATGPT 带来的变革带来的变革大模型算法大模型算法.23 4.1 大模型时代的引言:DOUBLE DESCENT(双下降)现象.23 4.2 首要关键技术:TRANSFORMER模型.24 4.3 GPT 快速迭代,从 GPT1.0 迅速步入 3.5 时代.24
9、4.4 国内外 AI 大模型项目百舸争流.26 4.5 相关标的.30 1)商汤科技.30 2)科大讯飞.32 3)云从科技.33 4)依图科技.34 5)旷视科技.35 5 算力与网络是大模型运行的必要条件算力与网络是大模型运行的必要条件.37 5.1 大模型发展,算力需求激增.37 5.2 GPU/GPGPU/FPGA 多路线支持算力.37 5.3 高带宽网络是对人工智能算力的重要支撑.39 5.4 量子计算有望成为 AI 算力突破的“神助攻”.45 5.5 相关标的.48 1)海光信息:国产 CPU 与 GPGPU 重要参与者.48 2)复旦微电:FPGA 受益算力增长.49 3)中际旭
10、创:全球光模块龙头迎来 800G 时代.51 4)联特科技:欧美中低速 WDM 主流供应商,数通光模块“黑马”.52 5)天孚通信:光通信精益制造代表,光引擎、激光雷达成长速度快.52 6)国盾量子:量子计算机已实现原型机搭建.52 Table_CompanyRptType 行业研究行业研究 敬请参阅末页重要声明及评级说明 3/80 证券研究报告 7)浪潮信息:国内领先 AI 服务器厂商.52 6 从元宇宙到大制造,大模型应用领域不断丰富从元宇宙到大制造,大模型应用领域不断丰富.54 6.1“生成式 AI”在互联网及元宇宙应用.54 1)“生成式 AI”在智能客服领域的潜在应用.54 2)“生
11、成式 AI”在搜索引擎领域的潜在应用.56 6.2 AI 赋能制造业转型升级,智能制造浪潮兴起.63 1)智能装备产业百花齐放,工业机器人与高端数控机床空间广阔.63 2)智能工厂是实现智能制造的载体,协作机器人与智能仓储物流是工厂新星.69 6.3 AI 赋能工业互联网,打造高效率设备管理和生产流程.72 6.4 人工智能助力汽车智能化.75 1)智能驾驶:从驾驶辅助到自动驾驶.75 2)智能座舱:从出行工具到出行管家.77 风险提示:风险提示:.79 Table_CompanyRptType 行业研究行业研究 敬请参阅末页重要声明及评级说明 4/80 证券研究报告 图表目录图表目录 图表图
12、表 1 CHATGPT 开启收费模式开启收费模式.8 图表图表 2 CHATGPT 操作界面操作界面.9 图表图表 3 CHATGPT 模型流程图模型流程图.10 图表图表 4 TRANSFORMER模型工作流程模型工作流程.11 图表图表 5 中国按类别划分的人工智能软件市场中国按类别划分的人工智能软件市场.12 图表图表 6 数据已成为五大核心生产要素之一数据已成为五大核心生产要素之一.13 图表图表 7 2015-2021 年年 GDP 增速与数字经济增速增速与数字经济增速.14 图表图表 8 2015-2020 年数字经济占年数字经济占 GDP 的比重的比重.14 图表图表 9规划提出
13、规划提出“1+7”的指标体系的指标体系.14 图表图表 10 2017 与与 2022 年人均联网设备数量年人均联网设备数量.15 图表图表 11 2017-2022 全球网络流量全球网络流量.15 图表图表 12 全球大数据市场规模全球大数据市场规模.15 图表图表 13 全球大数据软件市场规模全球大数据软件市场规模.15 图表图表 14 我国大数据市场规模我国大数据市场规模.16 图表图表 15 我国大数据软件市场规模我国大数据软件市场规模.16 图表图表 16 人工智能基础数据服务流程与主要产品人工智能基础数据服务流程与主要产品.16 图表图表 17 训练数据需求量(条)训练数据需求量(
14、条).17 图表图表 18 受访者遇到的与数据相关的难题及比例(受访者遇到的与数据相关的难题及比例(%).17 图表图表 19 2017 至至 2029 年中国数据标注行业市场规模年中国数据标注行业市场规模.17 图表图表 20 2021 年我国数据标注行业下游需求占比(年我国数据标注行业下游需求占比(%).17 图表图表 21 面向面向 AI 的数据治理产业图谱的数据治理产业图谱.18 图表图表 22 星环科技发展历程示意图星环科技发展历程示意图.19 图表图表 23 星环科技股权结构星环科技股权结构.20 图表图表 24 星环科技产品格局星环科技产品格局.20 图表图表 25 海天瑞声产品
15、服务矩阵海天瑞声产品服务矩阵.21 图表图表 26 海天瑞声训练数据集服务的算法模型应用场景示意海天瑞声训练数据集服务的算法模型应用场景示意.22 图表图表 27 BIS-VARIANCE图内的双下降曲线图内的双下降曲线.23 图表图表 28 TRANSFORMER模型自监督层结构模型自监督层结构.24 图表图表 29 TRANSFORMER模型架构模型架构.24 图表图表 30 OPENAI GPT 发展历程发展历程.24 图表图表 31 不同模型参数量与模型精度的关系不同模型参数量与模型精度的关系.25 图表图表 32 GPT-3 到到 GPT-3.5 的演进过程的演进过程.26 图表图表
16、 33 大模型发展迭代图大模型发展迭代图.27 图表图表 34 百度文心生态图百度文心生态图.28 图表图表 35 ERNIE3.0 模型架构模型架构.28 图表图表 36 MINDSPORE自动并行框架自动并行框架.29 图表图表 37 大模型训练需求对比大模型训练需求对比.30 图表图表 38 SENSECORE商汤商汤 AI 大装置中心大装置中心.30 图表图表 39 商汤科技主要产品结构商汤科技主要产品结构.32 图表图表 40 科大讯飞业务全景示意图科大讯飞业务全景示意图.33 图表图表 41 云从科技主要产品及服务图谱云从科技主要产品及服务图谱.34 Table_CompanyRptType 行业研究行业研究 敬请参阅末页重要声明及评级说明 5/80 证券研究报告 图表图表 42 依图科技主要解决方案依图科技主要解决方案.35 图表图表 43 旷视科技旷视科技 AIOT 软硬一体化解决方案软硬一体化解决方案.36 图表图表 44 算力需求变化算力需求变化.37 图表图表 45 深度学习中训练和推理的演示深度学习中训练和推理的演示.38 图表图表 46 全球全球 GPU 行业