收藏 分享(赏)

大厂抢做ChatGPT百度能否“狂飙”?_周文斌.pdf

上传人:哎呦****中 文档编号:2362827 上传时间:2023-05-08 格式:PDF 页数:12 大小:3.54MB
下载 相关 举报
大厂抢做ChatGPT百度能否“狂飙”?_周文斌.pdf_第1页
第1页 / 共12页
大厂抢做ChatGPT百度能否“狂飙”?_周文斌.pdf_第2页
第2页 / 共12页
大厂抢做ChatGPT百度能否“狂飙”?_周文斌.pdf_第3页
第3页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、大厂抢做 ChatGPT,百度能否“狂飙”?文/周文斌 编辑/张心怡ChatGPT 席卷全球,在中国叠加出了一个更强冲击波。如今,从市值千亿的互联网企业高管,到路边卖菜的大爷大妈,大家都乐此不疲的在谈论 ChatGPT,比如事前让它帮忙“算一卦”,或者聊聊谁将被优先替代。用网友的话说,ChatGPT 出现之后,就像村里来了个免费算命的。当然,要说通用人工智能取代大部分人类的工作那肯定还比较遥远,但 ChatGPT 的出现仍然在科技圈扔下了一枚“原子弹”。在二级市场,包括百度、网易有道、360 等几乎所有和 ChatGPT 沾上边的企业,股价都在近期拔地而起。而在股价高涨的背后,企业也都在试图搭

2、上 ChatGPT 这辆快车。2023 年 2 月 7 日开始,百度率先宣布了自家类 ChatGPT 产品的名字文心一言,之后网易有道宣布在教育场景研发类 ChatGPT 技术,阿里、腾讯、京东也都纷纷表态。但从全球范围来看,ChatGPT 这颗“原子弹”还是率先在搜索引擎领域炸开。比如微软拿到 ChatGPT 之后的第一件事,就是将其和搜索引擎 Bing 结合,并且已经展开内测;谷歌也闻讯而动,仓促发布 Bard,并也表示要在搜索领域落地。在国内,百度文心一言发布后,CEO 李彦宏今年一季度的 OKR(目标与关键成果)也被媒体扒了出来,写着要“引领搜索体验的代际变革”。除了搜索之外,Chat

3、GPT 的应用也在向其他领域延伸,比如微软计划将其接入包括云业务在内的所有产品线。百度文心一言发布后,小度随后发布了首款搭载 ChatGPT 同源技术的平板产品。除此之外,以 ChatGPT 为代表的大模型在自动驾驶、翻译、文本撰写等方面也都有落地。显而易见,AI 将会逐渐波及到几乎整个信息技术行业让所有的业务用 AI 重新做一遍。而在中国,百度是第一家公布类ChatGPT产品的公司,也是最大的搜索引擎公司。那么,在“All in AI”之后的第六年,ChatGPT 来了,百度将会发生哪些变化?机遇和挑战,哪个对百度更多一些?AS INTERNET GIANTS RUSH TO DEVELOP

4、 CHATGPT,CAN BAIDU WIN THE COMPETITION?34应用实践2023 年 2 月 7 日,百度公布了自家类ChatGPT的产品名称“文心一言”,成为 ChatGPT 席卷全球之后第一家跟进相关产品的国内企业。从这往后,网易有道、京东、阿里、腾讯纷纷表态,相关计划已提上日程。做一款类似ChatGPT 的产品,成为当前许多企业最紧迫的一件事情。不过,虽然现在投入类 ChatGPT研发的企业如过江之鲫,但也有业内人士指出,大多数做同类产品的企业只是在原有的产品里加入了一个 BOT(工程建设模式),因为并不是每家公司都具备自己建语料库和特征工程的能力,毕竟做这件事情不仅花

5、钱多,而且效果还不一定好。所以这里面其实就涉及到一个问题,即做一个类 ChatGPT 产品到底需要具备哪些底层能力?比如 ChatGPT 基于 GPT-3.5 这个大语言模型训练,使用了约 45TB 数据,包含约 1 万亿个单词的文本内容。这些数据显然不是从网上爬取下来就能用,谁能率先做出中国 ChatGPT?WHICH COMPANY WILL BE THE FIRST TO SUCCESSFULLY DEVELOP CHINESE VERSION OF CHATGPT?有做模型训练的工程师就提到,他们之前训练模型时使用了某社交平台的数据,导致该模型“除了骂人什么都不会”。所以对于模型训练来

6、说,高质量且大规模的数据来源本身就是一个问题,而要训练如此大规模的数据也太烧钱。有数据显示,GPT-3 训练的硬件和电力成本就达到 1200 万美元。这其实也是 OpenAI 和 Anthropic 会分别接受微软和谷歌投资的原因。就35PRACTICAL APPLICATIONS 是“背靠大树好乘凉”(给到充足的资金和落地场景),所以微软、谷歌都分别和 OpenAI、Anthropic 签订了大型的云计算供应合同。就像 360 公司创始人周鸿祎说的:“这个东西最终还是要拼算力的。”除了算力的支持,ChatGPT 的训练需要引入“人工标注数据+强化学习”来不断微调预训练语言模型,以此来让大语言

7、模型(LLM)学会理解人类的命令指令的含义,以及让 LLM 学会判断对于给定的 prompt 输入指令,给出什么样的回答才是优质的。整体上,这都反映了 ChatGPT 背后,对于大语言模型、数据来源、特征工程等更具体的工程性问题。所以就像搜狐创始人张朝阳在节目星空下的对话中一直坚持的那样,ChatGPT 的产生,是从量变到质变的结果,它积累了很多年,绝对不是一个新企业进去就能做好的技术。那什么样的企业更适合做中国的ChatGPT 呢?周鸿祎的答案是有搜索业务的公司,他认为做搜索的公司在这方面有许多优势。比如在算力方面,做搜索的公司都有服务器集群。在数据积累和自然语言处理方面,搜索引擎本身需要每

8、天在全网爬取所有的网页,而人类真正积累的36应用实践知识库就存在于这些网页里;同时搜索本身就需要做大量的自然语言处理,和人类知识标注,这些都是 GPT 模型必备的基础。“GPT 模型做出来之后,它实际上像刚具备学习能力的小朋友一样,并不会马上表现出很强悍的智能,它需要用户不断地使用,而搜索引擎每天有巨大的用户流量,有用户每天的支撑,有搜索词可以对它进行修正和持续不断的训练,这个飞轮才能不断的越转越快。”周鸿祎提到。而回过头来,从搜索业务的角度来看,国内做ChatGPT 最有优势的自然是百度,作为看家本领,百度搜索坐拥千亿级全网索引,覆盖超 50 亿实体的中文知识图谱。此外,从 2017 年百度

9、宣布“All in AI”到今天的 6 年多里,百度还建立了全栈 AI 技术构架,百度将这样的技术构架分为四层,分别是芯片层、框架层、模型层和应用层。比如在底层算力层面,百度在 2020 年发布了第一块专注于数据中心和云计算业务的量产 AI 芯片昆仑芯 1 代。目前,昆仑芯已经量产了 2 代,并达到数万片规模部署。比如在框架层,百度飞桨深度学习平台集深度学习核心框架、基础模型库、端到端开发套件和丰富的工具组件于一体,到 2022 年 5 月,飞桨官方37PRACTICAL APPLICATIONS 支持的产业级开源算法模型超过 500 个,发布了 23 个 PP 系列模型。到 2022 年 1

10、2 月,飞桨已汇聚 535 万开发者。而基于飞桨深度学习平台,百度训练了文心大模型。在 2022 年 AI 绘画火热的时候,百度基于文心大模型推出了 AI 绘画平台文心一格。到 2022 年 11 月,文心已累计发布 11 个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,推动行业的智能化转型升级,这也让百度在大模型的应用上积累了丰富的经验。整体上,从算力到应用,百度在各个层面都有关键的自研技术,这其实也是为什么百度能在ChatGPT 上线仅仅两个月后,就能迅速宣布推出自家的类 ChatGPT 大模型,并给出具体上线日期的原因。有业内顶尖的 NLP 专家对笔者表示,

11、他认为百度的 NLP 能力在中国是最好的,但真正做出像 ChatGPT 同等水平的产品,可能至少还需要一年。不过百度已经确认,文心一言“3 月和大家正式见面”,而他们做到了。38应用实践正如最适合做“ChatGPT”的是搜索公司一样,ChatGPT 落地的第一战也从搜索展开。比如微软在“拿到”ChatGPT之后,第一件事就是将其与Bing搜索相结合,紧跟着谷歌也表示将推出类似的模型,并以“搜索伴侣”的形式使用。在国内,百度发布文心一言的第二天,有媒体就扒出来了李彦宏 2023 年第一季度的 OKR“引领搜索体验的代际变革”。搜索,这个互联网 1.0 时代的业务在人工智能时代被 ChatGPT再

12、次推到了风口浪尖上。作为第一家将搜索和 ChatGPT 结合的企业,微软目前已经开放融合了ChatGPT 的 Bing 的全球内测。新版本的 Bing 没有搜索栏,取而代之的是一个写着“向我提问吧”的对话框,用户可以在其中输入问题并展开对话。搜索对百度不只是防御战更是一场攻坚战BAIDU SHOULD NOT ONLY DEFEND AGAINST CHATGPT,BUT ALSO TRY HARD TO IMPROVE ITS SEARCH CAPABILITIES39PRACTICAL APPLICATIONS 和传统搜索只能通过关键词给出结果展示,然后由用户自己在海量信息中筛查有效内容不

13、同,升级后的Bing可以帮助用户完成整个信息筛选和内容整理的过程。比如根据微软发布会上的展示,用户可以让新版 Bing 编写一份为期五天的墨西哥城旅行行程单并且转化成一封电子邮件,随后发送给他的家人。除此之外,在Bing 给出的示例中,还涉及到包括做计划安排、写诗和创作故事、制定菜单、提供买车建议等等生活的方方面面。如果说上一代搜索引擎搜索的是信息,那升级后的搜索引擎搜索的就是知识,并且可以通过这种方式,成为用户的“全职助手”。事实上,随着移动互联网的发展越来越成熟,搜索作为 PC 互联网时代的产品一直都面临着许多挑战。比如移动 App 将互联网的信息割裂成一个又一个孤岛,在这样的背景下,搜索

14、变得越来越场景化,搜索需求也在被不断分化。比如越来越多年轻人将小红书作40应用实践为搜索的第一选择,同时微信、今日头条、知乎、B 站都有自己独特的信息和展现形式。而随着搜索的场景和需求被逐步解构,这块业务放在公司整体估值上也通常会被低估。而目前,无论是百度还是谷歌,搜索业务在营收中的占比都在 60%左右,这其实也直接影响了百度和谷歌的估值。但新一代产品的升级,再次让市场对搜索引擎可以应用的场景有了更多期待,估值也自然水涨船高。一个最直接的表现是,在宣布自己类 ChatGPT 产品“文心一言”的名字之后,百度股价当时就上涨的超 13%。如今,随着 ChatGPT 对传统搜索能力的提升,“搜索”这

15、个产品的定义也将被改写,所以这不仅对百度来说是一场“老树焕新”的机会,对于只在全球搜索市场占比 2.46%的微软必应也是难得的一次开疆扩土的机会。所以说,推出中国版 ChatGPT,然后接入搜索,对于百度来说不只是一场防御战,更是一场攻坚战。41PRACTICAL APPLICATIONS 除了百度、微软和谷歌之外,AI 对企业的影响也越来越大。2023 年 1 月 27 日,美 版 头条 BuzzFeed 宣 布 使 用 ChatGPT来创作之后,股价在两天里暴涨了306.94%。2 月 8 日,网易有道宣布投入到 ChatGPT 同源技术在教育场景的落地研发,当前股价盘前涨超 20%。类似

16、的例子还有很多,最近只要有公司宣布正在研发类 ChatGPT的产品,无论是否有实际进展,股市都会“先涨为敬”。虽然这种现象背后有炒作和跟风的因素,但这其实也宣告了一种潜在的变化,即二级市场的投资者对企业估值逻辑的改变。在互联网行业的估值逻辑里,我们通常更关注营收、用户规模、MAU(月活跃用户人数)等数据及其增速,但如今投资者更关心一家企业是否具备下一代技术能力。而在这个时代,AI 已经被当成底层技术,被认为是今后推动企业发展的重要底层驱动力。而具体到百度、微软或者谷歌这样的企业来说,ChatGPT 要改变的显然不只是搜索,而是所有的业务线。以百度为例,在云业务上,百度一直强调智能云的标签,其特点是它能够将 AI 的能力赋能到具体的用 AI 将传统业务再做一遍42应用实践REDO TRADITIONAL BUSINESSES WITH AI场景中,比如实现某些具体场景的数据识别、清洗、分类的自动化等等,并以此来提高效率。如果百度智能云与百度文心一言结合,那使用百度智能云的企业就可以直接调用文心一言的能力来解决自己场景里的具体问题。这其实也是微软为什么需要将 ChatGPT 接入它的 Az

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2