1、78DOI:10 16614/j gznuj skb 2023 04 007ChatGPT 类人工智能及其生成物的刑法思考李翔,旷银(华东政法大学 刑事法学院,上海200042)摘要:ChatGPT 类人工智能是一种以“概率分布”为核心的大语言模型,在出色应用表现的背后,其并未脱离弱人工智能的定位。相较于以往的人工智能,主要体现出“工具”属性的弱化和“类人”属性的增强。此类人工智能尚不具备刑法中的辨认、控制能力,无法成为刑事责任主体。在著作权领域,人工智能本身不符合著作权保护的立法目的,无法成为著作权主体,但无人类参与的人工智能生成物属于具有独创性的“智力成果”,应作为受著作权法保护的作品。在
2、该类作品的权利主体认定上,人工智能的研发者、使用者均不具备权利主体资格,可以借鉴“孤儿作品”制度,设立专门机构并将其拟制为人工智能作品的权利主体。具有著作财产权属性的作品可以成为著作权的对象以纳入刑法保护范围。具体而言,基于人工智能及其作品的特征,应排除 刑法 第 217 条第 3 至 5 项的适用;单一复制行为同样具有社会危害性,“复制发行”应理解为“复制或复制且发行”,在侵犯人工智能作品犯罪中存在适用空间;在行为定性上,应当区分不同情形进行具体分析。关键词:ChatGPT;刑事责任主体;人工智能生成物;著作权犯罪;刑法保护中图分类号:D924 3文献标识码:A文章编号:1001 733X(
3、2023)04 0078 14Two Thoughts of Criminal Law on ChatGPT like GenerativeArtificial IntelligenceLI Xiang1,KUANG Yin2(1 2 School of Criminal Law,East China University of Political Science and Law,Shanghai 200042,China)Abstract:ChatGPT is a type of artificial intelligence that is a large language model b
4、ased on the“probability distribution”as its core Despite its outstanding application performance,it has not departed from the position of weak artificial intelli-gence Compared with previous artificial intelligence,it mainly embodies the weakening of the“tool”attribute and thestrengthening of the“hu
5、man like”attribute Such artificial intelligence does not have the recognition and control abilitiesstipulated in criminal law and cannot become the subject of criminal responsibility In the field of copyright,artificial intel-ligence itself does not meet the legislative purpose of copyright protecti
6、on and cannot become the subject of copyright How-ever,creations generated by artificial intelligence without human involvement are considered“intellectual achievements”with originality and should be protected by copyright law Works with copyright property rights can also be the subject ofcopyright
7、protection under criminal law egarding the identification of the subject of rights for such works,neither the de-velopers nor the users of artificial intelligence have the qualifications to be the subject of rights Therefore,a specialized a-gency can be established to act as the subject of rights fo
8、r artificial intelligence works,using the“orphan works”system asa referenceKey words:ChatGPT;criminal responsibility subject;artificial intelligence generated object;crime of infringing copy-right;criminal law protection*收稿日期:2022 11 30基金项目:上海市哲学社会科学规划项目“轻罪立法研究”(2022ZFX004)的阶段性成果。作者简介:李翔(1976),男,江苏泗
9、洪人,法学博士,华东政法大学刑事法学院教授、博士生导师,研究方向为刑法学;旷银(1997),男,贵州遵义人,华东政法大学刑事法学院博士研究生,研究方向为刑法学。79以 ChatGPT(Generative Pre trained Transformer)为代表的生成式人工智能带来了 AIGC(AIGenerated Content)领域的技术革新,成为时下最火热的话题之一。自 2022 年 11 月 30 日 OpenAI首次发布 ChatGPT 以来,各种生成式 AI 应用井喷式发展。如 GPT 4、Midjourney、Gen 2 等,不仅能够做到对话、翻译、生成代码、识别图片内容,甚至能
10、够根据文字直接生成图片、音视频等。Chat-GPT 是人工智能发展进程中一次质的飞跃1,也被认为是继数据库和搜索引擎之后的全新一代的“知识表示和调用方式”2 7。正如计算机的出现将人们引入互联网信息时代,ChatGPT 类生成式人工智能或许正在开创人工智能领域发展的新篇章。技术带来便利的同时,风险也应运而生。尽管有观点认为 ChatGPT 等新型智能系统在科技水平上没有变革性突破,离实现通用人工智能还有现阶段技术水平难以克服的障碍,但这种技术跨越已然引起了人类社会对技术伦理、法律规制、数据安全等风险的广泛担忧。在刑法领域,人工智能技术的更新,使人们再次提出疑问,ChatGPT 类生成式人工智能
11、是否具备刑事责任主体资格?在此基础上,其强大的生成功能是否意味着生成内容可以成为著作权法中的“作品”?如果不具备主体资格,对其生成物又该如何予以保护?针对上述问题,下文将立基于 ChatGPT 类生成式人工智能的运行原理展开分析。一、ChatGPT 类生成式人工智能的运行机制分析(一)ChatGPT 的基础 Transformer 的运行原理2017 年谷歌团队发表了一篇重磅论文Attention Is All You Need,提出了一种新的神经网络架构 “Transformer”,逐渐取代了之前流行的卷积神经网络(CNN)和循环神经网络(NN)两种深度学习模型,在自然语言处理(NLP)领域
12、大受欢迎,再次将人工智能发展推向了一个新的历史高度。而这正是 ChatGPT 诞生的基础,当前互联网领域层出不穷的各类大语言模型也均是基于Transformer 架构形成。Transformer 作为一种神经网络架构,旨在解决自然语言处理(NLP)任务,通过注意力机制研究、理解句子中使用的单词及上下文,并从中提取关键信息3。其主要有四个核心部分,编码器(Encoders)、解码器(Decoders)、前馈网络(FNN)和自注意力机制(SA)3。其中,在编码器和解码器中均包含了前馈神经网络和注意力模块。在 Transformer 架构的基础上,主要发展出了编码语言模型、解码语言模型以及编解码语言
13、模型,ChatGPT 便是仅包含解码器的预训练模型。其针对语言的生成方式存在一个“拆分重组”的过程,大致可以简化为三个步骤:(1)当一句自然语言输入后,会算法处理进行向量化,转化为计算机语言;(2)被转化的向量通过注意力机制进行权重计算,从而得出不同的概率或者说注意力得分,从中选取概率最高的向量作为结果;(3)得出的结果通过自回归(Auto regression)机制与之前的输入结合成为模型下一步的新输入,直到生成一个完整的序列为止。Transformer 架构最大的特殊之处,也即整个架构的核心,就是注意力机制。该机制可以学习序列中不同位置之间的依赖关系,从而在处理每个位置的信息时,模型能够考
14、虑到其他所有位置上的信息。其能够如同人一样,将计算集中在重要的部分。应用到 NLP 任务中,就是通过权重计算,标明字词间的相互关系,并嵌入上下文信息4。概言之,注意力机制就像一份拼图的参照表,将语言规律以权重计算的形式表达为计算机语言,判断哪些结果概率更高,与前后信息更为契合。Journal of Guizhou Normal University(Social Science)*业内人士、图灵奖得主杨立昆等人认为,ChatGPT 等新型智能系统在科技水平上没有变革性突破,离实现通用人工智能还有现阶段技术水平难以克服的障碍。80(二)ChatGPT 的运行原理及发展机制在 Transforme
15、r 的基础上,生成式预训练模型(GPT)、双向编码器表达模型(BET,BidirectionalEncoder epresentation from Transformers)、DALL E、LaMDA、Jurassic 1 等各种大规模预训练模型层出不穷,一种“大数据+大模型”的大规模预训练范式转变4 正不断改写着人工智能领域的发展历史。而 ChatGPT 便是基于 GPT 3 5 系列预训练语言模型微调而成。ChatGPT 类语言模型的特点之一是对词语序列的概率相关性建模,即根据输入的语句预测接下来不同语句出现的概率分布5。简言之,ChatGPT 可以根据上文预测下一个词出现的可能性,所以
16、也可以看作统计语言模型6。例如,在给定“罪刑”两个字后,它就可以生成“法定”或者“均衡”等,同时将生成结果与之前的字词结合,在“罪刑法定”或“罪刑均衡”的基础上,再次生成“原则”等,如此往复,形成所需要的结果。这种生成模式也被形象地称为“文字接龙”7。而选择生成“法定”还是“均衡”,则取决于概率的分布。换言之,这种语言模型给出的回答并非根据数据库进行相关搜索而拼凑,而是根据字词关系进行统计计算的结果。从 ChatGPT 的技术结构而言,其表现为“语料体系+预训练+微调”的基本模式8。分析其生成过程,主要表现为三个环节:第一,“无监督学习”(Unsupervised Learning)9。传统依序计算的一般语言模型,在给定一段较长的文本时,由于上文字词在计算环节离下文较远,下文生成时受到的影响也会被削弱,导致语义搭配出现偏离。而 ChatGPT 所采用的 Transformer 这一“注意力机制”则弥补了这一缺陷。其模仿人脑对重要信息抓取的机制,可以在生成下文的过程中过滤掉上文不重要的信息,并保留关键信息,从而实现连贯顺畅的表达。这一学习过程不需要人工干预或监督,只要语料数据足够丰富,它