1、1002023年第2 期(总第18 7 期)东财经大学学报数字经济理论与应用GPT-4影响的全面分析:经济高质量发展与国家安全防范宋信强,刘明杰,陈家和(广东财经大学,广东广州510 32 0)摘要:人工智能自诞生以来历经多次迭代演进,现已成为世界经济和社会变革的重大驱动力量。大型语言模型ChatGPT的问世及其选代版本多模态GPT4的发布,颠覆了人类对生成式AI的认知,引发全球广泛关注。在全面建设社会主义现代化国家的重要起点和关键阶段,我国的主要目标是经济高质量发展取得新突破。CPT4代表的AI算法和模型技术在生产、金融、营销、教育、医疗、外贸和投资等领域均具有广阔应用前景,未来必将成为我国
2、经济高质量发展的重要抓手,赋能更多行业和场景。但以CPT4技术为代表的人工智能应用也会给国家经济、政治、法律和社会等领域带来诸多安全风险与挑战,须采取系列安全防范策略掌控好AI应用风险,为我国经济高质量发展与国家安全保驾护航。关键词:人工智能;ChatGPT;G PT 4;高质量发展;国家安全中图分类号:F49;F424;TP18文献标志码:A文章编号:10 0 8-2 50 6(2 0 2 3)0 2-0 10 0-13一、引言2022年11月30 日,美国人工智能公司OpenAI发布了ChatGPT(C h a t G e n e r a t i v e Pr e-t r a i n e
3、d T r a n s-former,即CPT-3.5),不仅可通过上下文与用户对话,还可完成包括文本生成、自然语言处理、语音识别、数据分析、计划编制、情感分析、编写代码等在内的多种任务。发布仅5天就受到百万用户热烈追捧,上线仅两个月其月活跃用户即突破1亿,刷新了Twitter保持了9 个月的人工智能(ArtificialIntelli-gence,AI)软件记录。ChatGPT爆红后,国内外头部科技公司竞相作出反应。如微软与OpenAI公司密切关联,率先将ChatCPT接入必应搜索引擎和Edge浏览器,以ChatCPT技术打造了必应Chat AI,每日活跃用户因此增加了6 倍,必应搜索引擎日
4、活跃用户突破了1亿,人工智能大语言模型技术引人Office应用程序,圆收稿日期:2 0 2 3-0 3-2 0基金项目:国家社会科学基金重点项目(2 2 AJL005)国作者简介:宋信强(19 8 0-),男,河南商丘人,广东财经大学数字经济学院生态环境资源与经济社会系统协同演化重点实验室讲师,博士:刘明杰(19 9 6-),女,河北石家庄人,广东财经大学公共管理学院研究生:陈家和(19 9 5-)(通讯作者),男,广东梅州人,广东财经大学公共管理学院助理研究员。参见集成ChatGPT后微软必应日活量首次破亿,https:/w w w.16 3.c o m/d y/a r t i c l e/
5、H VD C L6 NH 0 519 8 C JN.h t m l。101GPT4影响的国家安全防范展宋信强,刘明杰,陈家和推出Microsoft365Copilot;谷歌紧急推出了基于LaMDA的实验性人工智能程序Bard;韩国电信运营商SK电讯打出了“超级应用 重拳,计划在2 0 2 3年内推出人工智能聊天机器人“A.”(晓镜,2 0 2 3)1。国内如百度、京东、36 0 等多家公司也纷纷推出对标ChatCPT的产品。如前京东AI掌门人创办了衔远科技入局ChatCPT,“不设上限”招揽中国OpenAI合伙人;36 0 公司计划尽快推出类ChatCPT技术的demo版产品;阿里计划将AI大
6、模型技术与钉钉深度结合;腾讯公司基于AI大模型、算法、NLP等领域的技术,将进一步开展前沿研究和应用探索。北京时间2 0 2 3年3月15日凌晨,OpenAI再度公布了大型多模态模型CPT4(G e n e r a t i v e Pr e-trainedTransformer4),此举颠覆了业界并引发社会各界广泛关注。GPT4遵循GPT、G PT-2 和GPT-3的研究路径,通过深度学习并利用更多数据和更多计算方法,创建了更复杂和能力更强的语言模型,不仅可以处理图像、文本并生成文本输出,而且可处理更复杂、更细微的指令。GPT4是OpenAI努力扩展深度学习的新里程碑,创造了AI历史上前所未有
7、的新的历史高度。紧随其后,百度预热已久的人工智能生成式对话产品于2 0 2 3年3月16 日亮相,其对标ChatGPT甚至是GPT-4的全新一代知识增强大语言模型、文心大模型家族的新成员一一文心一言(ERNIEBot)正式发布。美国东部时间2 0 2 3年3月16 日,微软也发布了基于GPT4平台支持的AI新功能-Copilot(副驾驶),它将适用于Word、Po w e r Po i n t、Ex c e l、O u t l o o k 等微软热门的Microsoft365商业软件。但ChatCPT是把“双刃剑”。当人们惊叹CPT4在各种专业和学术基准上表现出人类水平时,其安全隐患亦不可忽视
8、。ChatGPT和GPT4已触手可及,拉扯冲撞着人们惯有的参与生产生活的模式和框架,并继续狂在超越人类的赛道上(张佳欣等,2 0 2 3)2 。因而只有全面了解ChatGPT及CPT-4模型的运作机理、应用领域、应用场景及应用的优势与劣势,了解其对经济高质量发展及国家安全可能带来的风险和威胁,采取适当管控措施,处理好发展与安全的关系,才能充分发挥新一代AI技术助力我国经济高质量发展的作用。二、GPT-4的演化历程、创新特点及优劣势人工智能技术不断革新,不仅影响了人们的生活方式、工作方式,甚至会重构经济模式和社会结构。从19 9 7 年“深蓝”(DeepBlue)战胜国际象棋冠军,到2 0 16
9、 年AlphaGo击败世界围棋冠军,再到2023年ChatGPT横空出世,之后又迅速升级迭代至GPT-4,人工智能的进步空间难以估量。GPT4的出现标志着自然语言处理(NLP)领域取得了重大突破。充分梳理人工智能发展脉络,了解GPT-4的工作机理、创新特点、优势和局限性,同时关注其潜在风险和不足,有助于我们正确拥抱和利用AI技术。(一)AI发展历程自AI概念诞生以来,AI领域经历了波澜壮阔的发展历程,各种尖端技术不断取得突破。进入21世纪,深度学习、大数据、云计算等为AI发展带来了新的机遇和挑战。GPT系列模型的出现具有划时代意义,为AI在广泛领域的拓展应用奠定了基础。AI诞生于2 0 世纪4
10、0 50 年代。19 50 年,艾伦图灵提出的“图灵测试”为AI发展奠定了基础,其提出的“图灵机”则为现代计算机理论奠定了基础;19 56 年,美国计算机科学家约翰麦卡锡(JohnMcCarthy)等人在达特茅斯会议(Dartmouth Conference)首次提出AI概念,标志着人工智能的诞生(Bu c h a n a n,2 0 0 5)【3。50 7 0 年代是AI的黄金时代,颠覆性产品包括:美国斯坦福国际研究所(SRI)推出的首台人工智能机器人Shakey,它能自主进行感知、分析环境、规划行为并执行任务;世界第一个聊天机器人ELIZA,它能通过脚本理解自然语言处理,并可与人类通过文本
11、互动;还有计算机鼠标的发明,彻底改变了人机的交互方式,为现代互联网奠定了根基。7 0 8 0 年代是AI发展的瓶颈期。早参见 GPT4产品介绍,https:/ w w.c a c.g o v.c n/2 0 17-0 1/2 3/c _112 0 36 6 7 48.h t m。102广东财经#报(2 0 2 3年第2 期)期的成功与突破提高了人们对AI未来发展的期待,但专家系统(Expert Systems)在处理复杂问题和扩展知识库方面暴露出诸多问题,计算机无法支持大规模的AI应用,人们对AI的批评与怀疑开始出现(D r e y f u s,19 7 2)【4,政府和机构的研究投资逐渐停止
12、,AI发展进入低迷状态,但神经网络和反向传播算法等研究仍在进行。但与此同时AI领域开始取得新进展,专家系统(Expert Systems)、自然语言处理(NLP)、机器学习和计算机视觉等表现尤其亮眼。8 0 年代末9 0 年代初,研究者们发现专家系统(Ex-pert Systems)的实用性仅局限于某些特定情境。8 0 年代晚期,美国国防部高级研究计划局(DARPA)不再支持人工智能,AI发展再次进人冬天。20世纪9 0 年代至2 1世纪初,深度学习在计算机视觉、自然语言处理等领域取得显著进展,颠覆性产品包括IBM的电脑“深蓝”(DeepBlue)、使用自然语言回答问题的“沃森”(Watson
13、)以及Google人工智能AlphaGo,它们在某些领域都展现出超越人类的水平。2018年至今,AI开启了新纪元。OpenAI陆续发布了一系列GPT(Generative Pre-trained Transform-er)模型,在自然语言处理领域取得重大突破。从GPT到ChatGPT再到CPT4,数据规模、算法、算力均呈指数级增长,AI发展由此开启了新的篇章。2 0 2 2 年11月,ChatGPT(即CPT3.5)一经发布即引发颠覆性的创新学习,成为能帮助人类创造真实价值的AI模型;2 0 2 3年3月,ChatCPT迭代更新为多模态的大模型GPT4,标志着AI从单模态交互进展为多模态交互。
14、(二)GPT系列模型的迭代演化迄今为止,OpenAI已发布了5个GPT版本,分别是GPT-1、G PT-2、G PT-3、C h a t C PT(G PT-3.5)和GPT-4(见表1)。表1GPT系列模型一览表模型发布参数数数据集数据量训练方法目前局限性名称时间量(亿)BooksCorpus和英文维基于Transformer模型,采只能处理单语言文本,不能GPT2018.61.175GB基百科用自回归方式预训练较好地适应新任务WebText(即社交媒体基于深层Transformer模只能处理单语言文本,可能CPT-22019.215平台Reddit上高赞文40GB型,采用自回归方式预训输出
15、存在偏见或不真实的章)练,能够输出流畅文本内容只能处理单语言文本,可能CommonCrawl等多个基于深层Transformer模输出存在偏见或不真实的CPT-32020.51750数据源(包括WebT-45TB型,采用自回归方式预训内容,需要大量计算资源和ext)练,能完成多种NLP任务存储空间基于深层Transformer模可能输出存在偏见或不真ChatCPT未公布(包括文本代未公布(可能型,采用自回归方式预训2022.11未公布实的内容,需要大量计算资(GPT-3.5)码混合体)超过50 TB)练,能接受文本输人,可进源和存储空间行流畅对话基于深层Transformer模可能输出存在偏见
16、或不真未公布(可能型,采用自回归方式预训CPT-42023.3未公布未公布实的内容,需要大量计算资超过10 0 TB)练,能接受文本和图像输源和存储空间人,可进行流畅对话注:此表由作者根据相关资料整理得出2018年,OpenAI公司开发了语言模型GPT-1,其训练文本为5CB(1.17 亿参数量)。通过深度机参见(Alan D.Thompson:whats in my AI?a comprehensive analysis of datasets used to train CPT-1,GPT-2,GPT-3,GPT-NeoX-20B,Megatron-1B,MT-NLG,andGophe),https:/lifearchitect.ai/whats-in-my-ai/。103宋信强,刘明杰,陈家和GPT4影响的全面发展与国家安全防范器学习,CPT-1能生成人类可以理解的自然语言。GPT-2的训练文本增至40 CB(15亿参数量),但因不具有特别功能而未引起广泛关注。CPT-3的训练文本急增至45TB(17 50 亿参数量),且自2 0 2 2 年5月起其知识储备呈现几何级增长,每天新