1、摘要:在我国数字经济快速发展的背景下,生产与研发越来越依赖于数据的采集与挖掘,数据作为一种生产要素成为信息时代的重要资源。然而数据产权归属的争议阻碍了数据要素市场化的进程,数据难以得到充分的流通与使用。基于数据要素的经济特性,从数据生成的具体场景出发,研究认为数据作为生成品其初始产权应当归参与生成过程的主体所有,初始产权的确立可以通过参与主体之间分散的市场化契约完成。数据要素分级授权作为一种协商机制能够以较低的协商成本与监管成本实现数据确权,具有高效性与可行性。政府需要保障数据确权过程的公平性并对数据流通与使用的合法性进行监督,推动数据要素分类分级治理体系的建立。关键词:数据要素数据确权分级授
2、权产权理论数字经济一、引言随着我国迈入数字经济时代,数据作为一种生产要素在经济中发挥着越来越重要的作用。根据中国互联网协会提供的数据,2020年我国大数据产业规模已经达到了718.7亿元,同比增长16%,增幅全球领先。党的十九届四中全会提出,数据应当作为生产要素参与分配,要建立、健全由市场评价贡献、按贡献决定报酬的机制。2020年中央进一步将数据要素列为五大生产要素之一,指出要加快培育数据要素市场,加强数据资源整合和安全保护。促进数据要素市场化、加快并规范数据的流通、充分发挥数据资源价值对于我国数字经济的发展意义重大。然而由于数据产权界定尚未明确,当前数据交易开展的范围和交易量是有限的(邢会强
3、,2019)。数据产权模糊也使得监管措施难以施行,非法采集、买卖个人信息的市场乱象屡见不鲜。数据产权确立是数据交易的前提,只有通过清晰的产权界定才能保障数据要素持有者通过数据获得合法的收益。因此,推动数据要素市场化首先需要对数据复杂的经济和法律属性进行明确,探索出公平、高效、可行的产权确立方案。数据要素具有虚拟性、规模报酬递增、外部性、非竞争性和排他性,目前已有一些文献对数据要素的经济特性进行了较为全面的论述(格特纳等,2000;阿奎斯蒂等,2016;伯格曼等,2018;琼斯、托内蒂,2020;徐翔等,2021;熊巧琴、汤珂,2021)。数据要素独特的性质使得数据确权无法直接沿用其他要素的确权
4、方法,一些学者相继提出了不同的数据确权观点与方案。数据要素能够创造经济利益,因此当前很多研究都主张数据权利是一种财产权,或者至少承认数据具有财产权属性(龙卫球,2017;程啸,2018;申卫星,2020b),但在数据产权归属问题上存在较大分歧。以用户数据为例,典型的数据确权方案大体上可以概括为 3 类,即分别主张由企业拥有数据产权、个人拥有数据产权和“模糊”数据产权。主张企业拥有数据产权的学者认为,企业对于其合法收集的数据应当享有独立所有权,或者为之确立新型数据财产权,以提高企业参与数据经济的激励(程啸,2018;龙卫球,2018)。这类观点强调企业既是数据创造的核心贡献者也是利用数据要素的主
5、体,但是将数据产权完全赋予企业会使得个人隐私以及公共信息安全*本文系研究阐释党的十九届六中全会精神国家社会科学基金重大项目“党的十八大以来推动数字经济高质量发展的实践和经验研究”(22ZDA041)阶段性成果,并得到国家自然科学基金项目“共享经济的演化与治理研究”(71872098)及清华大学宁夏银川水联网数字治水联合研究院的资助。戎珂为本文通讯作者。基于生成场景的数据确权理论与分级授权*刘涛雄李若菲戎珂基于生成场景的数据确权理论与分级授权经济学-22DOI:10.19744/ki.11-1235/f.2023.0022管理世界2023年第2期难以得到充分保护,也否定了信息提供者为数据生成作出
6、的贡献。从隐私保护以及提供信息的激励出发,也有一些研究认为应当由消费者掌握其个人数据产权(米勒、塔克,2018;琼斯、托内蒂,2020)。消费者个人作为相关信息提供者对于数据权利的诉求应当予以肯定,但完全由个人享有数据产权则忽视了企业在数据采集与加工过程中投入的成本,使得企业缺乏动力投资于数据创造,不利于异质性的数据得到充分流转汇聚从而产生价值。部分研究认为数据确权需要平衡各方的利益,因此主张多主体共同拥有数据或对数据产权进行分割(张新宝,2015;刑会强,2019;申卫星,2020b),但是数据产生的价值以何种比例分配、产权分割以后数据能否进行交易、谁能够交易数据等关键问题仍然未能明确。其他
7、“模糊”数据产权的方案则认为明晰的数据产权界定难以实现且不必要,应当从“数据归谁所有”转向“如何利用数据”的探索(梅夏英,2016;姚佳,2019;戴昕,2021;许可,2021;胡凌,2022),例如通过数据信托解决信息主体与数据实际控制者之间不平衡的权力关系(冯果、薛亦飒,2020;翟志勇,2021)。本文之所以将这些方案称之为“模糊”数据产权方案,是因为这些方案在本质上回避了明晰产权的要求,其对数据产权的界定是不完备的,无法对相关数据后续能否分享、是否可交易或何种规则下可交易进行明确回答。概括起来,当前关于数据确权问题的讨论主要存在以下3点不足。第一,现有研究不能为数据确权提供一个可靠的
8、理论框架。如前所述,主张企业或用户拥有数据所有权的确权方案没有充分体现多元主体在数据创造过程中作出的贡献,而“模糊”数据产权的方案也很难兼顾数据确权的灵活性与完备性。第二,数据是一种副产品为现有多数研究所认同(伯格曼、博纳蒂,2019;琼斯、托内蒂,2020;维尔德坎普、钟,2019),然而随着数据在生产、营销活动中越来越发挥核心作用,数据也可能是有意识生产的主产品,甚至企业会为了获取数据而提供其它的商品或服务。忽视数据作为主要生成品的特性会导致对各方在数据创造过程中的贡献考察不够充分。第三,目前研究聚焦在平台收集的个人数据如何确权的问题之上,对于其他类型数据的确权讨论并不充分。现实中数据的种
9、类非常丰富,个人数据之外的数据要素也为数字经济的发展提供重要动力。数据确权问题需要一个更加一般性的讨论框架。数据是一种生成品,而非天然存在的禀赋。基于这一观点,本文建立了一个理论框架,从生成品确权的“按贡献分配”以及“事前确权”的原则出发,对数据的生成过程进行分析,把数据生成参与方区分为信息提供者和数据采集者,提出数据的初始产权应该在参与数据创造的各方之间分配。生成场景的多元性以及场景性公正原则意味着自上而下的确权方案并不合理,数据初始产权的确立应该是一个分散化的、各参与方基于一定规则进行协商从而缔结契约的结果。从方法论上,数据合约的协商可以看做一个合作博弈的过程,根据各方的贡献、估值以及谈判
10、地位实现数据确权。针对数据产权协商过程可能存在的高昂协商成本与监管成本,本文提出了数据初始产权确立的分级授权机制,并通过合同标准化思想、经济学模型以及应用案例对该机制的优势与可行性进行论述。本文的边际贡献在于提出了一套相对完备的数据要素确权理论和基于该理论的可行的确权机制。本文强调数据是一种生成品,并由此出发建立数据确权理论。本文提出的确权理论充分考虑了数据要素的独特性质,对数据生成各参与方的贡献予以承认,能够解决经济中绝大部分原始数据的确权问题。同时,本文对于政府在数据确权过程中应当承担的角色进行了说明,对于制定数据要素相关监管政策具有明确的现实意义。本文后续内容安排如下:第二部分构建基于生
11、成场景的数据要素确权理论体系;第三部分提出数据要素分级授权方案,对分级授权的原理及可行性进行分析;第四部分将理论框架与分级授权方案应用至各类原始数据确权场景;第五部分总结全文,结合我国数据确权与交易的现状对相关监管政策提出建议,并对本文局限性以及未来研究方向进行阐述。二、理论框架:基于生成场景的数据要素确权财产权(property rights)可以定义为建立在对人有用的物体上的权利,我国法律体系下财产所有具体表现为对财产占有、使用、收益和处分的权利(何真、唐清利,2006)。本文并不是从法学层面对数据各项权利的性-23质进行探讨,而是在经济学语境下讨论数据产权的确立问题。在经济学理论中,产权
12、和所有权(ownership)通常不做区分,均指对物品进行处理并因此获得相应报酬的权利(德姆塞茨,1967;阿尔奇安,1989),本研究将沿用这种表述。(一)数据是一种生成品一种物品被称为要素,是因为它是后续生产的投入品。但要素自身可能是一种自然禀赋,也可能是另外一个生产过程的产品,即生成品。在常见的生产要素当中,土地和自然资源就属于自然禀赋,而资本和知识则更多地是一种生成品。禀赋和生成品的确权方式是完全不同的。自然禀赋的产权归属通常依赖于特定的历史与文化。比如,不同的社会制度和传统下土地产权制度有很大的不同。而对于生成品而言,其初始产权应该归于参与生产的各方,各方根据生产之前达成的协议实现生
13、成品产权的确立。例如,两人合作发明某专利,专利所有权归两位发明者;如果属于职务发明,则相关单位也可能按照事前签订的合同获得专利所有权的一部分。数据是一种生成品。根据国际电工委员会提供的定义,信息是关于事实、事件、事物、过程或思想等客体的知识,而数据是被记录下来的信息,是信息的数字化载体。信息只有被人们收集、记录、处理、储存后,才成为数据。为了得到有利用价值的数据,需要有相关主体对信息进行采集、清洗,该过程需要借助工程师的脑力劳动以及传感器、存储设备等数据基础设施才能完成,越优质的数据往往也越依赖于采集的方法与投入(德姆琴科等,2013;黑斯廷斯等,2019;雷德曼,2020;穆尔等,2021)
14、。来自业界的证据显示,数据采集、处理和存储过程所需要投入的成本是十分高昂的,这也进一步说明了数据是一种生成品,必须有相应参与方承担数据生产的成本。数据的生成主要涉及两个参与方:信息提供者与数据采集者。信息提供者可以是个人,也可以是群体,他们提供的信息是数据生成的起点。数据采集的主体更多情况下是企业、科研工作者以及政府部门。为了完成信息向数据的转化,采集方需要付出一定的资本、劳动并辅以特定的技术。如果用函数来表示数据的生成过程,则可写为:(1)其中,y表示生成的数据量,e代表原始信息数量,x1,x2,代表其它投入数据生成的要素,包括劳动力、资本、技术等。由此可见,数据是信息提供者与数据采集者共同
15、创造的结果,缺少任何一方,信息到数据之间的转化过程都无法实现。一旦接受了数据是一个生成品的概念,则可以得到数据确权的两个基本原则,即“按贡献分配”和“事前确权”。所谓按贡献分配,是指数据既然是各方“联合生产”的结果,其所有权的分配应该按各方的贡献进行划分。按贡献分配在传统经济学理论中经常被表述为按边际贡献获酬。然而在数据生成的过程中,很难对各方边际贡献进行统一衡量。例如,消费者为个人数据的生成所承担的隐私成本就很难统一计算。因此,数据确权应该基于特定的生成场景进行。所谓事前确权,是指参与各方在生成过程开始之前对生成品的产权进行预先分配。只有事前对生成品产权的分配方案形成了共识,才能为生产过程提
16、供正确的激励。当一份新的数据形成时,各方在数据产权中占据多大份额需要由各方在数据生成前通过合约予以确立,即形成数据产权初始合约(简称初始合约)。订立初始合约能够确保数据要素和明晰的产权相伴而生,而不是彼此分离,这是数据后续一切合法利用与流转的基础。因此,本文认为在数据确权中落实“按贡献分配”和“事前确权”的关键性制度安排在于,基于不同的数据生成场景由数据生成过程的参与者形成数据产权初始合约。下面分别对“生成场景”和“初始合约”两个关键问题进行讨论。(二)数据要素的生成场景与确权各主体对于数据要素生成的贡献以及他们对数据价值的预期依赖于数据生成场景,即多元利益主体在特定的社会时空下交互并形成数据的过程。图 1 展示了一些典型的数据生成场景。数据采集方的主体相对清y=f()e,x1,x2,基于生成场景的数据确权理论与分级授权经济学-24管理世界2023年第2期晰,主要是科研人员、企业和政府,数据采集目的也是明确的。信息提供方的确定以及其利益诉求则更加复杂,因为信息的提供可能是无意识的,且信息提供的主体通常是数据要素负外部性的主要承受者。信息提供方的主体可以是个人或企业等等,甚至一切客观存在