【国盛证券】GPT4展望：多模态chatGPT下一站 2.pdf

资源描述

1、请仔细阅读本报告末页声明请仔细阅读本报告末页声明证券研究报告|行业点评 2023 年 02 月 28 日计算机计算机 GPT4 展望：展望：多模态，多模态，CHATGPT 下一站下一站 GPT4 有望于有望于 2023 年发布年发布。根据财富杂志报道，OpenAI 还有更多创新蓄势待发，OpenAI 在贝塔测试版 GPT-4 中采用了更强大的大语言模型，预计该版本将于今年甚至很快发布。关于 GPT4 的猜测众说纷纭，尘嚣甚上，且公开信息较为有限，我们在此总结各路信息、展望未来，供各位投资者参考：相较前代，相较前代，GPT4 可能不会有参数量上的巨幅提升，而是在其他方向寻求提高可能不会有参

2、数量上的巨幅提升，而是在其他方向寻求提高。在 2023 年 1 月 18 日的一场公开采访中，当 OpenAI 的 CEO Sam Altman 被问及一张在推特上被疯转的图表时（该图表称 GPT-3 拥有 1750 亿参数，而 GPT-4 可能拥有 100 万亿参数），Altman 称其“完全是胡说”。这证明了即将到来的 GPT4可能不会往一味巨幅扩大参数量的方向去走，而可能向其他方向寻求提升。GPT4 有可能是一个多模态模型，可用于图像等领域有可能是一个多模态模型，可用于图像等领域。根据 The Seattle Times 新闻报道，GPT4 可能是一个很像 ChatGPT 的系统，只生成

3、文本；或者它也可以把图像和文字结合起来。一些风投机构和微软员工已经看到了它的运行情况，但是OpenAI 还没有确定新系统是否会发布涉及图像的功能。此外，根据财富杂志报道，OpenAI 也确实在开发一款通过文字能生成视频的 AI 模型。若若 GPT4 转向多模态，转向多模态，未来输入输出可能出现图像、视频等未来输入输出可能出现图像、视频等形态形态，有望打开下游有望打开下游千行百业应用空间千行百业应用空间。NLP 只是大模型的应用领域之一，未来大模型的输入输出可以不仅限于文字，虽然当前影响力最强的 ChatGPT 是 NLP 模型，还可以包括图像、视频等多种形式，成为多模态模型，例如 OpenAI

4、的绘画 AI 模型 DALL-E2，在 AIGC 界引起过巨大反响的 Stable Diffusion 等等。传统的传统的 CNN 演绎下视觉应用解决问题都是单点模式，演绎下视觉应用解决问题都是单点模式，CHATGPT 多模态有望带多模态有望带来通用模式来通用模式。传统 CNN 模式下，视觉 AI 公司倾向于采用单点方式，在各个碎片场景中做客制化落地，定制化程度相对较高；若转向大模型模式，GPT4 的多模态能力有望带来通用化的模式，显著提升 AI 模型生产效率。例如，商汤科技的SenseCore AI 大装置中，模型层的模型工厂可以大幅降低人工智能生产要素的成本，提高人工智能的生产效率，实现

5、人工智能以自动化、自适应的方式进行生产和落地，模型工厂已开发超过 49000 个商用人工智能模型。我们认为，若我们认为，若 GPT4转向多模态，图像、视频等应用将转向多模态，图像、视频等应用将层出不穷层出不穷涌现涌现。其使用场景将远远不仅限于文其使用场景将远远不仅限于文字、问答与办公，打开有望未来字、问答与办公，打开有望未来 AI 在下游千行百业的应用空间，进一步打开市在下游千行百业的应用空间，进一步打开市场想象力场想象力。投资建议投资建议。建议关注：建议关注：1）视频场景：当虹科技、网达软件；2）视觉场景：海康威视、大华股份、云从科技、商汤科技。风险提示风险提示：AI 技术迭代不及预期风险；

6、经济下行超预期风险；行业竞争加剧风险。增持增持（维持维持）行业行业走势走势作者作者分析师分析师刘高畅刘高畅执业证书编号：S0680518090001 邮箱：相关研究相关研究 1、计算机：ChatGPT 技术篇：智能背后的秘密 2023-02-26 2、计算机：首批 Azure OpenAI 服务落地万科，大模型商业化进程持续加速2023-02-21 3、计算机：ChatGPT 算力需求是如何扩张的2023-02-19 -48%-32%-16%0%16%2022-022022-062022-102023-02计算机沪深扫码进群领取3、最新业报告、公司研究、专业咖分享1、优质研报免费获取

7、，业报告定期打包2、每推送业最新深度研报（精选10篇）2023 年 02 月 28 日 P.2请仔细阅读本报告末页声明请仔细阅读本报告末页声明内容目录内容目录 1、GPT4 展望：发力未必在规模，有望转向多模态.3 2、投资建议.7 3、风险提示.7 图表目录图表目录图表：掌舵人称推特上被疯转的此图“完全是胡说”.3 图表：用生成宇航员骑马图.4 图表 2：Stable Diffusion 生成的图像.5 图表 3：Stable diffusion 训练成本估算.5 2023 年 02 月 28 日 P.3请仔细阅读本报告末页声明请仔细阅读本报告末页声明 1、GPT4 展望：展望：发力未必

8、在规模，有望转向多模态发力未必在规模，有望转向多模态 GPT4 有望于有望于 2023 年发布年发布。根据财富杂志报道，OpenAI 还有更多创新蓄势待发，OpenAI 在贝塔测试版 GPT-4 中采用了更强大的大语言模型，预计该版本将于今年甚至很快发布。关于 GPT4 的猜测众说纷纭，尘嚣甚上，且公开信息较为有限，我们在此总结各路信息、展望未来，供各位投资者参考：相较前代，相较前代，GPT4 可能不会有参数量上的巨幅提升可能不会有参数量上的巨幅提升，而是在其他方向寻求提高，而是在其他方向寻求提高。在2023 年 1 月 18 日的一场公开采访中，当 OpenAI 的 CEO Sam Altm

9、an 被问及一张在推特上被疯转的图表时（该图表称 GPT-3 拥有 1750 亿参数，而 GPT-4 可能拥有100 万亿参数），Altman 称其“完全是胡说完全是胡说”。这证明了即将到来的 GPT4 可能不会往一味巨幅扩大参数量的方向去走，而可能向其他方向寻求提升。图表 1：OpenAI 掌舵人称推特上被疯转的此图“完全是胡说”资料来源：推特，国盛证券研究所 GPT4 有可能是一个多模态模型，可用于图像等领域有可能是一个多模态模型，可用于图像等领域。根据 The Seattle Times 新闻报道，GPT4 可能是一个很像 ChatGPT 的系统，只生成文本；或者它也可以把图像和文字结合

10、起来。一些风投机构和微软员工已经看到了它的运行情况，但是 OpenAI还没有确定新系统是否会发布涉及图像的功能。此外，根据财富杂志报道，OpenAI也确实在开发一款通过文字能生成视频的 AI 模型。实际上，实际上，NLP 只只是大模型的应用领域是大模型的应用领域之一，图像、视频等之一，图像、视频等领域也可使用领域也可使用 T2023 年 02 月 28 日 P.4请仔细阅读本报告末页声明请仔细阅读本报告末页声明大模型这一技术路径大模型这一技术路径。Transformer 虽然最早提出之时，用于 NLP 领域，但随着这一技术路径不断普及流行，图像、视频、音乐等领域也开始使用 Transform

11、er 的技术路线，探索各类跨类别任务。（比如根据文字指令输出图像等）未来大模型未来大模型的的输入输出输入输出可以不仅限于文字，还可以包括图可以不仅限于文字，还可以包括图像、视频等多种形式像、视频等多种形式，成为多，成为多模态模型模态模型。虽然当前影响力最强的 ChatGPT 是 NLP 模型，但大模型的能力远远不仅限于文字。输入文字生成图像、输入文字生成音乐、输入图像生成图像此类功能现在已经可以通过 AI 大模型一定程度上实现，这类模型被称为多模态模型，实际上实际上 OpenAI的绘画的绘画 AI 模型模型 DALL-E2 就是目前最知名的多模态模型之一就是目前最知名的多模态模型之一。除此之外

12、，其他知名多模态模型还包括在 AIGC 界引起过巨大反响的 Stable Diffusion，以及谷歌推出的音乐生成AI 模型 MusicLM 等。1）DALL-E 2：OpenAI 推出的 AI 绘画模型，在前代 DALL-E 的基础之上有了很大提升，可以直接根据文字生成图像，也可以输入图像后、子现成图像上根据文字指令进行部分修改，功能强大。图表 2：用 DALL-E2 生成宇航员骑马图资料来源：OpenAI 官网，国盛证券研究所 2）Stable diffusion：由 stability.ai 公司在去年开源的 AI 绘画模型，可以通过输入文字生成对应图像。由于效果极佳，模型一经开源即

13、在 AIGC 界引起极大反响。2023 年 02 月 28 日 P.5请仔细阅读本报告末页声明请仔细阅读本报告末页声明图表 3：Stable Diffusion 生成的图像资料来源：stability.ai 官网，国盛证券研究所多模态模型训练数据多模态模型训练数据为图像、为图像、视频等，视频等，规模远大于语言类模型，算力需求有望激增规模远大于语言类模型，算力需求有望激增。由于多模态模型使用图像、视频等多媒体数据进行训练，而此类文件大小远超文字。1）以Stable diffusion 为例，根据公司官网信息披露，该模型训练数据集为 LAION 5B 的一个子数据集，而 LAION 5B 的

14、数据包至少 80TB，规模已经远超传统语言类大模型训练时使用的数据量（一般是 GB 级的）。该模型使用 4000 块英伟达 A100 训练了一个月，算力需求庞大，若按 AWS 官网上租用价格（32.77 美元/小时/8 GPU）计算，则该模型训练成本可高达 4000/8*32.77*24*30=1179.72 万美元。2）无独有偶，DALL-E2 模型在训练时使用了 6.5 亿张图片，按单张图片大小 512*512 像素（约 256kb）估算，整体训练数据集大小高达约 155TB。由此可见，多模态大模型的训练对算力芯片数量需求远胜语言类模型，算力需求有望激增。图表 4：Stable diffu

15、sion 训练成本估算使用 A100 总数 4000 片 8 个 A100 每小时单价 32.77 美元训练时长 1 个月训练总成本训练总成本 1179.72 万美元万美元资料来源：亚马逊官网，国盛证券研究所 2023 年 02 月 28 日 P.6请仔细阅读本报告末页声明请仔细阅读本报告末页声明传统的传统的 CNN 演绎下演绎下，下游场景碎片化导致，下游场景碎片化导致视觉应用解决问题视觉应用解决问题倾向于单点倾向于单点模式模式。传统 CNN模式下，视觉 AI 公司倾向于采用单点方式，在各个细分场景中做客制化落地，定制化程度相对较高。旷视科技联合创始人、CTO 唐文斌在 2022 年

16、 9 月的人工智能与产业融合论坛上谈道，现阶段的 AI，一个核心挑战在于应用场景碎片化导致算法多样化。比如森林大火，识别有没有烟需要一种算法；仓库物流场景里，收货纸箱有没有破需要一种算法。算法多样化，一方面意味着需要规模化生产大量算法，另一方面需要考虑如何低成本生产每个算法。图表 5：传统 CNN 模式下，AI 模型开发效率较低资料来源：商汤科技官网，国盛证券研究所 CHATGPT 多模态有望带来通用模式多模态有望带来通用模式，显著提升模型生产效率与下游落地效率，显著提升模型生产效率与下游落地效率。例如，商汤科技的 SenseCore AI 大装置，它由模型层、深度学习平台、计算基础设施三个

17、部分架构而成。其中，模型层的模型工厂可以大幅降低人工智能生产要素的成本，提高人工智能的生产效率，实现人工智能以自动化、自适应的方式进行生产和落地，模型工厂已开发超过 49000 个商用人工智能模型。图表 6：商汤模型工厂已经开发超过 49000 个商用 AI 模型资料来源：商汤科技官网，国盛证券研究所 2023 年 02 月 28 日 P.7请仔细阅读本报告末页声明请仔细阅读本报告末页声明我们认为，若我们认为，若 GPT4 转向多模态，转向多模态，将大幅提升将大幅提升 AI 视觉方向生产效率，视觉方向生产效率，图像、视频等应图像、视频等应用将用将层出不穷涌现层出不穷涌现。其使用场景将远远不

18、仅限于文字、问答与办公，打开有望未来其使用场景将远远不仅限于文字、问答与办公，打开有望未来 AI 在在下游千行百业的应用空间，进一步打开市场想象力下游千行百业的应用空间，进一步打开市场想象力。2、投资建议投资建议建议关注：1）视频场景：当虹科技、网达软件；2）视觉场景：海康威视、大华股份。3、风险提示风险提示 AI 技术迭代不及预期技术迭代不及预期风险：风险：若 AI 技术迭代不及预期，NLP 技术理解人类意图水平未能取得突破，则对产业链相关公司会造成一定不利影响。经济下行超预期风险：经济下行超预期风险：若宏观经济景气度下行，固定资产投资额放缓，影响企业再投资意愿，从而影响消费者消费意愿和产

19、业链生产意愿，对整个行业将会造成不利影响，NLP技术应用落地将会受限。行业竞争加剧风险：行业竞争加剧风险：若相关企业加快技术迭代和应用布局，整体行业竞争程度加剧，将会对目前行业内企业的增长产生威胁。2023 年 02 月 28 日 P.8请仔细阅读本报告末页声明请仔细阅读本报告末页声明免责声明免责声明国盛证券有限责任公司（以下简称”本公司”）具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下，本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。本报告的信息均来源于本公司认为可信的公开资料，但本公司及其

20、研究人员对该等信息的准确性及完整性不作任何保证。本报告中的资料、意见及预测仅反映本公司于发布本报告当日的判断，可能会随时调整。在不同时期，本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息及资料保持在最新状态，对本报告所含信息可在不发出通知的情形下做出修改，投资者应当自行关注相应的更新或修改。本公司力求报告内容客观、公正，但本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用，不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户，不构成客户私人咨询建议。投资者应当充分

21、考虑自身特定状况，并完整理解和使用本报告内容，不应视本报告为做出投资决策的唯一因素。投资者应注意，在法律许可的情况下，本公司及其本公司的关联机构可能会持有本报告中涉及的公司所发行的证券并进行交易，也可能为这些公司正在提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。本报告版权归”国盛证券有限责任公司”所有。未经事先本公司书面授权，任何机构或个人不得对本报告进行任何形式的发布、复制。任何机构或个人如引用、刊发本报告，需注明出处为”国盛证券研究所”，且不得对本报告进行有悖原意的删节或修改。分析师声明分析师声明本报告署名分析师在此声明：我们具有中国证券业协会授予的证券投资咨询执业资格或相当

22、的专业胜任能力，本报告所表述的任何观点均精准地反映了我们对标的证券和发行人的个人看法，结论不受任何第三方的授意或影响。我们所得报酬的任何部分无论是在过去、现在及将来均不会与本报告中的具体投资建议或观点有直接或间接联系。投资评级说明投资评级说明投资建议的评级标准投资建议的评级标准评级评级说明说明评级标准为报告发布日后的 6 个月内公司股价（或行业指数）相对同期基准指数的相对市场表现。其中 A 股市场以沪深 300 指数为基准；新三板市场以三板成指（针对协议转让标的）或三板做市指数（针对做市转让标的）为基准；香港市场以摩根士丹利中国指数为基准，美股市场以标普 500 指数或纳斯达克综合指数

23、为基准。股票评级买入相对同期基准指数涨幅在 15%以上增持相对同期基准指数涨幅在 5%15%之间持有相对同期基准指数涨幅在-5%+5%之间减持相对同期基准指数跌幅在 5%以上行业评级增持相对同期基准指数涨幅在 10%以上中性相对同期基准指数涨幅在-10%+10%之间减持相对同期基准指数跌幅在 10%以上国盛证券研究所国盛证券研究所北京北京上海上海地址：北京市西城区平安里西大街 26 号楼 3 层邮编：100032 传真：010-57671718 邮箱：地址：上海市浦明路 868 号保利 One56 1 号楼 10 层邮编：200120 电话：021-38124100 邮箱：南昌南昌深圳深圳地址：南昌市红谷滩新区凤凰中大道 1115 号北京银行大厦邮编：330038 传真：0791-86281485 邮箱：地址：深圳市福田区福华三路 100 号鼎和大厦 24 楼邮编：518033 邮箱：明确分析向明确分析向明确分析向明确分析向产品分析流程找报告，上烽研报烽研报全业研报聚合检索平台明确分析向明确分析向明确分析向明确分析向产品分析流程找报告，上烽研报烽研报全业研报聚合检索平台

展开阅读全文