1、理论实践 楚天法治 人工智能创作授权机制的完善赵志恒(南京理工大学,江苏 南京 )【摘要】为促进人工智能技术的发展,避免人工智能创作过程中侵权问题,其授权机制有待完善.对于人工智能非表达性使用,应当适用合理使用制度;对于人工智能表达性使用,因其和原作品处于同一竞争领域,若使用合理使用制度将存在一定的争议性.同时,考虑到授权便捷性对于人工智能技术发展的重要性,可以使用集体管理制度.【关键词】人工智能;人工智能创作物;合理使用;表达性使用一、问题的提出 年,英国“计算机之父”阿兰图灵提出了“机器能否思考”的疑问,开启了让机器拥有人类智能的最初畅想。自此 之 后,人 工 智 能 技 术 不 断 发
2、展,年,由O p e n A I研发的聊天机器人程序C h a t G P T已得到广泛应用。人工智能软件对“创作”领域的“入侵”已经成为不可逆转的趋势,其对现行法律体系的冲击也成为法律界不得不去面对的事实,率先面临挑战的就是著作权领域。对于人工智能深度学习的过程,不可避免地需要收集已存在的作品并进行分析,该环节可能涉及著作权侵权问题。为避免在人工智能深度学习过程中频繁侵权,影响人工智能技术的发展,同时,保护原作品作者的权益,完善人工智能创作的授权机制尤为重要。人工智能深度学习过程的合法化可以寻求以下路径:其一,获得原作者的授权许可,其难点在于需要获得授权的对象过多,要求人工智能企业在使用作品
3、前,取得所有权利人授权并不现实,影响其商 业化。其 二 是适 用合 理使 用 制度,设定人工智能使用作品属于法定的非侵权条件,提高人工智能产业对作品的有效利用。其三是集体管理制度,在限制使用者随意使用原作品的同时,为使用者便捷获得授权许可提供了路径。根据人工智能创作的不同场景,对原作品权利人影响程度不同,也应当分别看待。二、人工智能创作侵权 以M a t t h e wB u t t e r i c k诉微软案为例(一)基本案情 年月,微软发布了一种可以自动生成计算机代码的新型人工智能技术,该工具名为C o p i l o t,并在免费试用一年后转为付费使用。C o p i l o t可以在程
4、序员编写代码时给出代码建议,程序员可以直接将C o p i l o t建议的代码块直接添加到自己的代码中,快速完成工作。C o p i l o t强大的编码能力来自一个叫做C o d e x的A I,由O p e n A I开发并授权给微软,其训练源是来自G i t h u b上的公共仓库。年 月,程序员兼律师M a t t h e wB u t t e r i c k与集体诉讼公司J o s e p hS a v e r iL a wF i r m合作,对微软、G i t H u b和O p e n A I提出了集体诉讼。该案件目前在审理过程中。原告认为,其一,微软无视基本的开源许可证条款和
5、其他法律要求,用他人的劳动成果获利,侵犯了众多开发人员在各类开源软件许可上的合法权利。具体而言,C o p i l o t未得到源代码作者的许可,亦无注明源代码作者姓名并注明许可证类型。其二,微软在面对C o p i l o t用户时,对自己进行的免责条 款应 当 无效,微软 将C o p i l o t给 的代 码 称为“建议”,称自己不从中主张任何权力,也不对它生成的代码作任何关于正确性、安全性和产权相关的保证。C o p i l o t在不标注代码来源的同时,却让用户遵守协议的这一免责条款属于推卸责任的行为。而被告方认为,在公开数据上训练A I属于合理使用。(二)M a t t h e
6、wB u t t e r i c k诉微软案的争议点在M a t t h e wB u t t e r i c k诉微软案中,双方争议的焦点在于微软通过在开源社区收集代码,并训练C o p i l o t的行为构成合理使用。美国著作权法第 条对合理使用制度的评价标准分为四个方面:()使用的目的和性质;()受版权保护的作品的性质;()使用部分占原著作权作品的量和实质程度;()使用对作品潜在市场或价值的影响。在本案C o p i l o t的使用场景中,对于第()项,开发者的目的为更快速生成代码,以获得更多的活跃用户并提高销量,与代码开发人员的目的一致。对于第()项,由于代码开发领域的特殊性,其是
7、否能够获得版权保护仍需要根据具体情况判断独创性,并且一般开源社区协议中允许开发者相互学习借鉴,但大段引用仍需标注出处。换言之,代码受版权保护程度较低且权利并不完整。该案中微软也是根据代码开源性,作为C o p i l o t生成代码属于合理使用制度范畴观点的重要依据。对于第()项,C o p i l o t在学习初期存在直接大段引用的情形,随着后续深度学习算法的完善以及学习程度的加深,后续可能有所变化,需根据具体证据进行判理论实践 楚天法治 断。对于第()项,代码开发人员完成作品的市场较广,且通常具有一定的商业价值,C o p i l o t的代码市场主要是开发人员,但最终作用于终端市场。C
8、o p i l o t广泛应用将削弱自主开发人员的竞争力。由于本案仍在进行中,更多的证据和论断有待进一步明确。(三)合理使用制度适用于人工智能非表达性使用对人工智能训练领域而言,合理使用制度是否适用需要具体分析。人工智能在数据库中学习的过程和创作作品的过程,可以分为表达性和非表达性。人工智能非表达性使用并不会生产作品表达的目的,其重点在于分析数据的特征。这种使用方式并不属于著作权人的权利控制范围之内,即使将原作品的全部或者部分表达性内容向社会大众展示,也构成合理使用。最为典型的例子为人脸识别技术的发展,训练人工智能识别人脸特征的算法需要使用大量的人物照片,其中部分照片可能在版权保护期内。人物面
9、部信息数据库包含数万幅从网络上收集的人物面部图像并配有姓名。此数据库的作用是为人脸识别的算法研究提供素材,并非用于生成人物面部图像。这些数据库中的图像来源于大量摄影师的作品照片,多数在著作权保护的期限之内,这些摄影作品中的光线、色彩和取景等因素,皆是受著作权保护的独创性表达,但人物面部信息数据库使用这些照片与原作品的独创性表达无关,与A u t h o r sG u i l dv G o o g l e案中的G o o g l e数字化扫描图书的复制行为类似,其与原作品的使用目的并不相同,由此也和原作品不属于相同竞争领域,属于合理使用的范畴。(四)人工智能表达性使用存在侵权的可能性对于表达性地
10、使用作品的人工智能,其对数据库中作品的使用涉及作品的独创性表达,例如A I绘画中将大量画师的画作用作训练数据,分析画作的表达性特征以生成新画作。虽然人工智能在新画作中并未直接复制原画作的部分表达,但新创作物的生成正是基于对原画作数据的分析和处理。在目的方面,生成创作物的目的和画师创作绘画的目的一致,都是为了让观众欣赏画作。在内容方面,A I绘画与原画师的作品虽然在具体线条、色彩等方面不一致,但整体风格一致,落入原画师预期的创作范围。当然,A I绘画算法可以学习大量画师的作品,以达到“稀释”绘画风格的目的,但整个过程中仍在大量借鉴原著作权作品。在市场竞争方面,A I绘画作品直接或者间接与原作品市
11、场一致,与原画师形成竞争关系。人工智能表达性地使用作品进行创作的行为,类似于人先通过学习理解原作者独创性表达,然后根据自己的理解后创作新作品。如果人的理解具有局限性,创作的后续作品在表达上和先前作品近似程度太高,则会侵犯在先作者的改编权。既然人并不会因为创作了有独创性的改编作品而豁免侵权责任,那么机器也不例外。因此,人工智能表达性地使用作品进行创作的行为,是否能够适用合理使用制度,仍需要具体从目的、借鉴内容和数量、市场竞争关系以及原作品的性质等方面分析。三、人工智能创作授权机制完善的对策和建议上文中已分析人工智能非表达性使用可以正常适用合理使用制度,但人工智能表达性使用若也适用合理使用制度,将
12、挤压自然人的创作空间。以下从利益平衡等原则提出有利于人工智能创作的版权法律制度建议。(一)合理使用制度运用于人工智能表达性使用作品的利弊人工智能表达性地使用作品,难以符合转换型使用的规则。若人工智能表达性使用作品无法适用合理使用制度,将使大多数人工智能机器学习的过程成为版权侵权行为,不利于人工智能产业的发展。人工智能科学的产生和推动的动力之一,就是帮助人们更快更好地完成工作,增强人的能力。在文学艺术创造领域,公式化的工作也可以利用人工智能完成,一方面可以提高创作效率另一方面自然人也可以专注于作品创作过程中相对更有创造性的部分。但是人工智能的技术路线决定了其对学习材料的数据有着较高的数量要求。相
13、对于自然人而言,人工智能没有抽象思维能力,其“学习”依赖于分析大量数据的特征,数据量的提高可以丰富人工智能的创作模型种类。例如,A I绘画作品从 年至今有了较快发展,与其大量画作供其学习有密切联系。没有合理使用制度的支撑,A I绘画创作可能会面临大量版权侵权的纠纷中。在许可市场现实层面,合理使用制度可以使得权利人无法许可或者不愿许可时,后续使用人能在学习作品的基础上完成新的创作,有利于文化艺术的发展。若人工智能表达性使用无法适用于合理使用制度,其学习材料都要求获取原著作权人的许可,则实际可能难以操作,无法形成作品许可市场。首先,人工智能机器学习要求的素材极多,获取许可过程中所需要的时间成本和资
14、金成本巨大,难以跟上技术创新的脚步。其次,原著作权人可能并不愿意将自己的作品当作人工智能的学习材料,从目前社会面上画师对A I绘画的反应来看,画师的作品被学习后将直接产生竞争关系,严重影响自身权益。获取原作者的许可也许会变成一条“存在路径”,仅在法律上存在解决路径,而实践层面无法达到。最后,若人工智能为避免机器学习过程中,对受著作权保护的作品产生侵权的情形,将倾向于取得已过著作权保护期限的作品作为学习材料。若人工智能仅获得 年前甚至 年前的作品作为素材,其创作物将带有严重的倾向性,仅能够满足目前文化艺术的一小部分市场,利用人工智能进行创作不免沦为“考古工具”,也失去了重要的价值。虽然人工智能表
15、达性使用若无法适用于合理使用制度,理论实践 楚天法治 在一定程度上会限制人工智能技术的发展,但合理使用制度若完全适用于人工智能表达性使用作品,则会产生更严重的问题。人工智能大量使用作品将无需经过著作权人的授权,将使得原作品的著作权人无法避免自己作品被人工智能当作学习的对象。鉴于人工智能作品与原作品存在一定的相似性,原作品的独创性表达和市场空间有可能被人工智能作品所取代。从另外一个角度评价,人工智能表达性使用作品在授权许可的著作权制度中开启了一个例外,对传统授权使用的方式难免不公平。总之,人工智能表达性使用仍不宜完全适用合理使用制度。(二)集体管理制度适用于人工智能表达性使用作品鉴于合理使用制度
16、适用于人工智能表达性使用存在局限性的情形,需要考虑采用其他更为合适的法律机制,来解决人工智能表达性使用作品中机器学习的问题,以达到兼顾保护原著作权人利益和促进人工智能技术发展的目标。在人工智能表达性使用作品的机器学习过程中,合理使用制度最大的弊端是没有给原作者拒绝的权利;反之,正常获取许可的弊端在于许可时间成本和资金成本太高,以至于无法进行技术开发。若参考法定许可制度,则原作者可以通过申明获得拒绝的权利,但是相应的报酬仍需要协商,成本问题仍无法解决。理想中的制度设计应当使得人工智能机器学习能够大幅度降低获取作品的成本,同时,给予原作者拒绝的权利。这种制度设计可以参考我国信息网络传播权保护条例第条的规定,网络服务提供者可以通过信息网络,向农村地区的人们免费提供我国公民、法人或者其他组织已经发表的种植养殖、防病治病、防灾减灾等与扶助贫困有关的作品,当然著作权人也有选择其作品不被传播的权利。该种制度的设计是为了保护相对弱势的农民的权益,虽然与人工智能机器学习不同,但可以借鉴整体利益平衡的制度设计。在该制度中,著作权人有拒绝自己作品被使用的权利,网络服务提供者也不必一一和著作权人沟通,同时,自