现在位置:首页 > 要闻动态 > 中心动态
董学耕 | 数据基础设施论纲Ⅳ——作为新质生产关系的数据基础设施
时间:2024-09-16
来源:

摘要:

数据基础设施不仅是一整套释放数据要素价值的基础设施,而且在数据价值化中还必须保障和平衡数据相关主体的价值权益,既要体现效率,也要促进公平,因此它实际上体现了数据生产关系,成为反作用于数据新质生产力健康发展的新质生产关系。本文在数据四大属性(主权属性、人身属性、公共属性和价值属性)基础上,论证了数据相关主体(主权国家、社会公众、数据处理者、数据来源者、数据使用者等)各自的数据权益,包括价值权益和安全权益;在深入分析数据技术特性和经济特性特别是其中的数据整体性、规模经济、范围经济和边际效用递增特性基础之上,论证了相关主体数据权益的一致性;进而在政治经济学层面上论证了数据个体所有制和数据共有制的辩证统一。需要发挥数据基础设施作为数据新质生产关系的作用,落实好数据产权关系、生产关系和分配关系,保障数据相关主体各自权益,使其密切协同一致,以充分发挥数据要素特性,真正让数据要素价值化、价值最大化,从而促进新质生产力发展。同时,更好发挥政府在数据要素收益分配中的引导调节作用,通过数据税对数据价值权益进行二次分配,以保障公共利益,抑制巨型平台垄断和寻租,并向数据来源者进行二次价值补偿。最后,数据个体所有制和数据共有制之辩证统一基础上形成的数据新质生产关系,以及承载这个新质生产关系的数据基础设施,能够最好地诠释在新时代中国特色社会主义市场经济条件下建立数据个人所有制,即重建马克思所倡导的个人所有制的伟大实践。

关键词:新质生产力;新质生产关系;数据基础设施;数据权益;技术资本主义;数据财政;数据共有制;重建个人所有制

前文[1-3]我们已经论述了数据基础设施的基本架构,包括了元数据基础设施、数据公共化基础设施、数据价值化基础设施、数据权益基础设施,以及数据安全基础设施。本文将论述数据基础设施所形成的数据生产关系,作为新质生产关系,以促进以数字经济为主要内容的新质生产力的快速和充分发展,极大释放新质生产力,增强经济发展的新动能。

我们知道,生产关系包括三方面的内容:一是生产资料的所有制形式,即劳动资料和劳动对象归谁所有;二是人们在生产过程中形成的地位及相互关系;三是由以上两个关系形成的分配、交换、消费关系。简要说,生产关系的三要素即生产资料归谁所有,人们在生产劳动中的地位和相互关系,消费品的分配方式。也就是(广义的)生产关系包括产权关系、(狭义的)生产关系和分配关系。

《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(即“数据二十条”)[4]是我国加快构建数据基础制度的指导性文件,从数据产权、流通交易、收益分配、安全治理四个维度,梳理了数据生产关系。

1.数据要素的特性

1.1数据定义及四大属性

数据是从物理空间到赛博空间的映射。物理世界的元素映射到赛博空间的数据。

物理世界的元素x即数据的关联对象或关联物。

数据=f(关联对象或关联物)

记为:d=f(x)

f为映射,反映x的某个侧面、属性或行为;d为数据。

但事实上,这个映射还与x的位置p、时间t相关,应记为:d=f(x,p,t)

也就是说,数据记录了物理世界的元素(关联对象或关联物)在某时某地的某个侧面、属性或行为,成为信息。质而言之,数据记录了人类的实践活动,成为现实世界的实践信息。

因此,数据反映了物理世界的某个侧面,即作为信息的“记录”载体。同时,信息便是数据“记录”的内容。[5]

数据和信息的关系是形式和内容的关系。在符号学的意义上,信息处于语义(内容)层,而数据则处于句法(符号)层。或者说,它们分别对应符号的所指和能指。它们既有区分,又不能割裂开来,而需要统一为一体。区分的目的在于分类规制,这也是我们在文献[6]中对数据的所指不同而进行分类的依据,数据需要分为涉私数据和非涉私数据等,同时,也才便于基于内容的分类对不同数据进行不同的形式化处理。

正因为我们依据数据和信息的形式和内容进行了细化分类,即已经明确区分了形式和内容,同时又不能割裂形式和内容,在此前提下,我们不再区分数据和信息,除非特别指明,数据(侧重形式)和信息(侧重内容)相统一,可以通用。

从现实世界的实践逻辑来规制数据空间的结构逻辑,数据具有主权属性、人身属性、公共属性和价值属性等四大属性,其位阶等级顺序是:主权属性>人身属性>公共属性>价值属性。这从根本上规定了数据要素的特性。[1-3]

1.2数据要素的技术特性

数据的技术特性是由数据属于数字空间(赛博空间)决定的,也就是由赛博空间的特性决定的。例如,(1)多主体采集,(2)多角度记录,(3)多媒体形式,(4)多模态共存,(5)依赖存储载体,(6)可复制,(7)可转移,(8)易传输,(9)无磨损,(10)使用非排他,(11)使用隐蔽性,(12)数据状态信息不对称,等等。

特别注意,第一,可复制,可转移的特性,也就是数据可共享、可开放,这在技术上无障碍,几乎零成本。因此,一方面,数据完全可以便利地实现共享开放;另一方面,数据如果不加保护,价值就等于零。可见“数据不出域”的要求不仅出于数据安全需要,也出于数据价值化需要。

第二,数据在使用上的非排他是正向特性,可以广泛使用;数据使用的隐蔽性和信息不对称则是逆向的,可能导致数据滥用,而必须加强这方面的法律法规建设,加强监管,落实数据相关方的知情权等权益。

1.3数据要素的权益特性

数据要素化旨在让数据进入生产、流通过程在开发利用中产生经济价值。数据要素价值化首先要理清楚数据权益。

数据权益涉及到数据相关主体,即数据权益是数据相关主体的权益。根据数据的主权属性、人身属性、公共属性和价值属性等四大属性,数据相关方包括了主权国家、社会公众、数据来源者(即关联对象、数据主体)、数据处理者和数据使用者,其中数据处理者包括生产主体和价值载体。

数据相关方的数据权益包括(1)价值权益和(2)安全权益。我们将在第3部分详解。

1.4数据要素的经济特性

价值属性是数据要素化的依据。数据要素化在于使用,在于进入生产、流通过程,进入经济循环,发掘其价值属性。数据价值化其实就是发掘其蕴含于人身属性和公共属性中的价值属性。

数据要素的经济特性主要就是指数据要素的价值特性。数据的价值特性是由蕴含在数据中的人类劳动决定的,具体到交换价值,是由数据构成的数据产品在具体应用场景中的使用决定的。因此,数据要素的经济特性围绕数据产品化这个核心。使用价值决定数据产品的市场价值,通过市场博弈而形成价格机制。

数据要素的经济特性或价值特性主要包括:

(1)数据产品服务功能的相对独立性;

(2)数据产品的场景相关性;

(3)数据产品的瞬间集成特性;[7]

(4)数据产品的价值稳定性;[7]

(5)数据产品对安全可信数据空间等数据基础设施的依赖性;[8,2,3]

(6)数据产品要求数据集合具备整体性;

(7)数据产品的所有权和数据资产特性;[9-11]

(8)数据产品来源数据的实时性;

(9)数据产品来源数据的用益物权和数据资源特性;[9,10]

(10)数据可脱敏,包括去标识化、匿名化;[12]

(11)数据可治理,形成数据中间产品并产生新价值;[12]

(12)数据时效性,数据贬值快;

(13)数据规模经济特性,数据边际效用递增,数据交互倍增;

(14)数据范围经济特性,数据范围越大,多样性越强,价值越大;

(15)数据平台化;

(16)数据生态化,等等。

特别注意,第一,关于(1)数据产品服务功能的相对独立性和(2)数据产品的场景相关性,这是数据产品的定义决定的。数据产品需要相对独立地对外提供服务,有两大核心特征:一是面向应用场景;二是需要有数据嵌入才能提供服务。[3]这也就同时要求(8)数据产品来源数据的实时性。

第二,关于(6)数据产品要求数据集合具备整体性、(12)数据时效性、(13)数据规模经济和(14)数据范围经济,这是和其他生产要素非常不同的经济特性。

我们在文献[3]中举了导航APP的例子。人们在使用导航APP的同时,又作为导航APP的数据采集端,在并不泄露个体数据的情况下,众多使用者的实时位置、速度数据作为导航APP研判道路是否拥堵的依据,并为其他使用者规划出行路径提供帮助。这就是数据产品在个人利用同时产生的公共利用,并在公共利用中产生新的使用价值。从中可以看到,一是数据时效性非常重要,一方面需要历史数据对导航进行大致规划,但更需要实时数据对导航进行实时精准规划,并随时调整,而对于实时精准规划,之前的历史数据就价值不大了,上一个时刻的数据在下一个时刻的规划中价值在快速衰减,直至趋近于零。二是数据整体性非常重要,没有整体性,就没有服务具体场景的数据产品。尽管离开个别数据特别是自身数据无法进行精准导航,但是如果没有历史数据、无数他者数据的背景,也同样无法为个体进行精准导航。个别数据是在整体数据的背景上发挥作用。三是数据规模经济和范围经济非常重要,衡量一个数据产品价值,没有一定规模是不可能产生价值的,而且规模越大,往往价值也越大。同一个区域,时空划分越精细,涉及主客体数量越多,使用频度越大,也就是数据量越大,数据产品能力越强,使用价值就越大;在同样的数据密度下,涉及区域越大,数据产品价值越大,省级应用大于县级应用,国家级应用大于省级应用,等等。

可见,数据的人身属性和公共属性在价值权益上具有一致性,并产生效用递增的经济价值。这种边际效用递增效应意味着数据公共性越大,价值性也越大。因此,我们一方面强调数据关联对象对数据的决定权,另一方面还要同等强调数据的公共属性,让两方面的价值一致起来。数据的主要价值在于社会交往和社会利用,即对公众有用。数据不是为了保护而保护,而是为了利用。即使对于涉私数据(不等于隐私数据),其主要价值也在于社会交往的可识别性。对于关联对象而言,自利与利他是一致的,在行使对数据的安全自决权的同时,也要让数据贡献到数据的整体性、规模性、范围性之中,在数据的公共属性中才能更好发挥自利性,发挥对自身、对公众的更大价值。

这种数据规模性、范围性和整体性以及人身属性、公共属性在价值权益上的一致性也是数据作为人工智能大模型预训练语料的理论基础。通过形成规模化、整体化的逻辑真实数据集,赋能人工智能大模型预训练。[12]

第三,关于(15)数据平台化和(16)数据生态化,正因为数据的开发利用依赖于以安全可信数据空间(如海南数据产品超市)为核心的一整套数据基础设施,数据要素的经济特性使其必然会向平台化发展,并在平台基础上形成数据生态系统。平台会充分利用数据的规模性和范围性,数据要素利用的平台网络越大,生态越丰富,平台价值的边际效用递增就越明显。

2.数据要素是能动的新质生产力

数据要素的特性,包括技术特性、权益特性和经济特性,决定了作为新的生产要素,其所催生的生产力、生产关系的新质属性。数据要素是新质生产要素。

2023年9月,习近平总书记在黑龙江省实地调研时首次提出“新质生产力”的概念,之后在多个场合又反复阐释:“新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。”新质生产力“由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生,以劳动者、劳动资料、劳动对象及其优化组合的跃升为基本内涵,以全要素生产率大幅提升为核心标志”。

在新质生产力的发展中,以互联网、大数据、云计算、人工智能等为代表的数字技术快速发展,数据成为新质生产要素,极大改变了劳动对象和劳动资料形态,推动新型劳动对象和新型劳动资料不断涌现,使数据要素成为新质生产力中最为能动的部分,构成数据新质生产力。数据不但是必不可少的生产要素,深刻融入生产、分配、流通、消费和社会服务管理等各环节,而且可以通过汇聚、重组、融合等途径多层次、多元化地实现价值倍增,与传统生产要素紧密结合,双向赋能,从而提升全要素生产率。在这个过程中,数据基础设施全面赋能数据新质生产力的发展,是数据新质生产力的重要载体。

我们知道,生产力具有三要素,即劳动者、劳动资料、劳动对象,我们将从三要素及其优化组合的角度来考察数据要素对新质生产力的贡献。

2.1数据劳动者

数据权益相关方都是数据生产力的贡献者,都是对数据要素价值化发挥作用的数据劳动者。首先,数据产品开发者是直接的数据劳动者。我们在研究数据价值化时曾经指出,数据产品化是核心,正是通过数据产品开发者,数据产品才得以生产出来,开发者是数据产品制造者,是直接的价值创造者,直接创造面向应用场景的使用价值。其次,来源数据提供者也是数据劳动者,其中的生产主体通过数据采集、治理等劳动而成为数据产品生产的“原材料”供应者,价值载体通过数据存储、治理以及平台工具提供等劳动成为数据产品生产的“装备”供应者,都共同参与了数据产品的价值创造。当然,细分的话,还会有从事数据产品流通、交易、营销等环节的数据处理者作为劳动者。再次,关联对象(数据来源者)也是间接的数据劳动者,随时随地在主动或被动地贡献数据。这点,我们在前面论述数据要素的经济特性,特别是数据的人身属性和公共属性在价值权益上的一致性时已经充分说明。最后,数据产品使用者也是贡献者,也是间接的数据劳动者。

关于数据使用者的贡献,举例来说,在ChatGPT诞生后,2013年诺贝尔化学奖得主迈克尔·莱维特堪称使用频率最高的人,短短一年多时间,他已经向ChatGPT提出了4万多个问题。他的结论是,ChatGPT最大的特点是“你笨它也笨,你聪明它也聪明”。也就是说,它的智能程度取决于人类的提问能力。[13]从中我们不是看到了使用者对大模型的贡献吗?高质量的提问是高级的智力劳动,借助于这种劳动,大模型得以学习、提高。

其实,数据使用本身也产生新的数据,使用过程也是贡献数据的过程,不同场景中的数据使用还叠加新的效用。因此,数据使用者也是间接的数据劳动者。并且由于这种使用,新产生的数据加入到数据产品生态系统中,在数据流量集聚中形成生态循环和价值递增。

同时,随着数据产品的大规模生产、大规模流通、大规模使用,全民数字素养会不断提高,这是数据生产力的不断提升,不仅数据处理者,尤其是数据人才,而且数据来源者、数据使用者作为数据劳动者,对数据生产力都会做出越来越大的贡献。

2.2数据作为劳动资料

劳动资料是劳动者在劳动过程中用来改变或影响劳动对象的一切物质资料或物质条件,劳动资料中起决定作用的是生产工具,生产工具是生产力高低的主要标志。

无需赘言,在当今数字化或信息化时代,信息技术已经成为最重要的生产工具,以数字产业化、产业数字化的形式赋能千行百业,具体体现在各类以数据赋能的数据产品中。这正是“产业互联网”“数据要素×”“人工智能+”等行动中所展现出来的数据对生产能力的极大促进和提升。例如工业软件,例如智能运输工具,等等,都是重要的数据产品,作为生产工具,都在极大提高全要素生产率。

2.3数据作为劳动对象

劳动对象是把劳动者的劳动加在其上的一切物质资料, 一般分为两类,一是没有经过加工的自然环境中的物质,如矿藏、森林,另一类是经过加工的原材料,如棉花、钢铁、粮食等。

数据是从物理世界到数字空间的映射,作为劳动对象,即成为在劳动中被加工的对象,劳动不仅作用于数据本身,也作用于数据所反映的物质资料。据统计,2023年我国数据生产总量达到32.85ZB,潜在应用价值超万亿元。数据作为劳动对象,具体体现在各种来源数据、数据中间产品(即经过加工的数据原材料),它们经过进一步加工劳动才变成面向应用的劳动成果,即数据产品。

2.4数据生产力三要素的优化组合

从生产资料角度看,生产资料包括劳动资料和劳动对象,数据作为新质生产资料,通过数据产品化成为劳动成果,进而作为生产工具,进一步深度赋能生产过程,并通过反向赋能来源数据以及数据中间产品使之成为劳动对象。

可以看出,数据作为新质生产要素,其对新质生产力的贡献不是单一的,而是全面的、综合的。数据劳动者不仅包括数据处理者,也包括数据来源者、数据使用者。数据不仅作为新质劳动对象,也作为新质劳动资料(生产工具),全面赋能经济社会发展。数据不仅本身形成新质生产力的闭环,而且通过“数实融合”进一步赋能实体经济。数据通过发挥协同优化、复用增效、融合创新的作用,有力促进其他生产要素的创新性配置,推动各种生产要素的网络化互通、集约化重组、供应链协作和生态化协同,从而大幅提升全要素生产率,以数字产业化、产业数字化的形态,形成以数据要素为核心的数字经济。

3.通过数据基础设施构建新质生产关系

生产关系是指人们在物质资料的生产过程中形成的社会关系,是生产方式的社会形式,包括生产资料所有制的形式,人们在生产中的地位和相互关系,产品分配的形式等。也就是说,生产关系包括产权关系、(狭义)生产关系和分配关系。其中,生产资料所有制的形式(也就是产权关系)是最基本的,起决定作用的。生产力决定生产关系,生产关系反作用于生产力,生产关系一定要适应生产力的发展,一旦生产关系不适应生产力状况,就会阻碍生产力发展。

具体到数据生产关系,就包括了数据产权关系、数据(狭义)生产关系和数据分配关系。数据生产关系一定要适应作为新质生产力的数据生产力的发展,也就是说,数据生产关系一定要上升为适应数据新质生产力的数据新质生产关系。数据新质生产关系也必须体现在数据基础制度之中,特别是体现在反映数据生产资料所有制的数据产权制度之中。数据产权制度作为数据生产关系中起决定性作用的部分,是数据基础制度的核心。体现数据产权关系、(狭义)生产关系和分配关系的数据基础设施[1-3]是数据基础制度的物质体现,因而是数据新质生产关系的重要载体。其中,特别要强调的是数据权益基础设施,是数据新质生产关系的核心。

3.1数据权益

1.3节我们讲到,数据相关方的数据权益包括(1)价值权益和(2)安全权益。此处详解。

3.1.1数据要素的价值权益

“数据二十条”[4]指出:建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制。我们需要注意,数据产权分置针对的是数据处理者的权益,不包括数据来源者的权益。并且,三权并非并列关系,它们之间有并列,有包含,也有递进关系。

数据生产主体包括数据产品开发者、来源数据提供者(数源单位)等,主要从事数据采集、治理、存储、加工、使用、开发、利用、提供服务等行为,其权益可以包括数据资源持有权、数据加工使用权、数据产品经营权等。数据价值载体包括可信数据空间(如海南数据产品超市)提供者、互联网平台、云服务商等,主要从事数据存储、治理、传输、公开、删除等行为,其权益可以包括数据资源持有权、数据产品经营权等。

数据关联对象包括自然人、法人等,既有可能是主动提供自身数据,更有可能是被动地关联,但其权益最为关键,即拥有对数据的知情权、决定权等。[6,14]应当落实“数据以人为本”,即落实数据关联对象对数据的决定权,作为数据公共利用和价值释放的前提,作为数据处理行为的前提,并通过基于数据公共化基础设施的关联对象“数字空间”来实现。[3]

特别注意,按照《个人信息保护法》[14]的原则,对于涉私数据,数据处理行为由关联对象进行授权,因此,数据资源持有权等三权其实无需第三方登记——否则,这个第三方登记权的权利来源在哪里呢?对于非涉私数据,如果要进行登记,需要登记的其实也不是数据资源持有权等三权,而应该是具有明确财务意义的相关权利,才具备《民法典》要求的“不动产物权”和“出质”等条件。这也就是说,具备“入表”条件的数据资产或数据资源才需要登记。[9]

数据要素价值权益的关键是确定数据相关方的价值权益边界,即通过数据产品化确权。[6]

数据产品开发者拥有数据产品所有权。其通过购买其他数据生产主体、价值载体的数据要素持有权,获取数据加工使用权,开发数据产品,通过在具体场景的具体使用中关联对象对涉私数据在线实时授权(关联对象行使数据决定权并获得使用便利)获得关联对象的权益让渡——成千上万的使用者每次使用时各自授权让渡其数据关联对象的权益——从而实现对数据产品的完整权益拥有,包括了对数据产品的占有、使用、收益、处分的权益(当然也包括了数据产品经营权),即获得数据产品所有权,并实现资产化,纳入财务体系。

数据生产主体、价值载体的数据要素持有权借助数据产品化而获得来源数据的用益物权。形成数据产品的来源数据的提供方,同样是借助于数据产品使用中关联对象的授权和让渡,通过数据产品作为价值中介,通过合约关系,反推出来源数据价值,使来源数据在具体使用中变身数据资源,从而实现数据资源化,并使来源数据提供方获得用益物权,进而纳入财务体系。

关联对象(数据主体)的权益体现,一是人格权益的让渡;二是使用便利的获得,即获得服务;三是其权益让渡不仅有助于自身获得服务,还有助于数据产品公共价值的实现,因此也应获得部分价值权益。这需要对关联对象数字空间被调用的流量等进行计量,通过平台返利或数据产品合约等方式来实现数据产品开发、使用过程对关联对象的一次分配,同时通过国家税收形式对数据价值权益进行二次分配。[3]

讨论数据价值权益,除了数据处理者和数据来源者(关联对象),我们切勿遗忘了另外两个重要主体,主权国家和社会公众。这是数据主权属性和公共属性的要求,并不抽象,而是要具体落实。

我们需要明确,数据价值属性不是天生的,而是来源于数据的主权属性、人身属性和公共属性。正因为数据具有主权属性、人身属性和公共属性,数据才是有价值的。因此,在主权属性不可触碰之外,数据价值化其实就是发掘其蕴含于人身属性和公共属性中的价值属性。

关于人身属性,数据处理者和关联对象的权益关系已如上述。关于主权属性和公共属性,涉及主权国家和社会公众两大主体,其价值权益具有一致性,数据处理者同样对其负有权益义务,具体将通过国家税收形式体现,即数据税——当然,数据税的具体实现是一个重要且复杂的问题,需要另外单独讨论,但是从义理和法理上说,这个税必须得有。

此外,数据公共属性对数据价值化的贡献在上文关于数据要素经济特性的地方已经做了充分论述。

3.1.2数据要素的安全权益

《数据安全法》[15]规定:开展数据处理活动,应当……履行数据安全保护义务,承担社会责任,不得危害国家安全、公共利益,不得损害个人、组织的合法权益。这意味着,数据价值化,只能在服从数据主权属性、人身属性、公共属性的前提下进行。首先,主权属性具有刚性,不可逾越,必须保障主权国家安全权益,涉及主权属性的核心数据、重要数据必须依法保护。其次,人身属性具有优先性,数据就关联对象可区分为涉私数据和非涉私数据,前者涉及人格权,必须依法保护,人格权也不可交易,数据只能在相关人格的授权下处理和使用。再次,公共属性要求数据为公众利用,共享开放、流通使用,并发掘其价值。最后才是价值属性,即数据价值的实现。

也就是说,数据开发利用行为需要保护主权国家、关联对象(个人和法人等)以及公众的安全权益,“不得危害国家安全、公共利益,不得损害个人、组织的合法权益”。

主权国家和社会公众的数据安全权益是一致的,主要通过数据安全和数据出境相关法律法规来保障。

特别注意,集合数据关联国家安全。如果说,单条的涉私数据主要涉及人身属性,那么集合数据则涉及群体权益,达到一定程度,就会涉及国家安全和公共利益,需要纳入国家和公共安全管理范畴。

数据人身属性相关方众多,多主体,多关联,涉及的安全权益复杂,是数据价值化中的难点,必须开发利用和安全保障并重。在数据要素利用中,数据关联对象将主动或被动地介入相关过程,数据保护和利用密切相联。关联对象的安全权益主要通过数据产品化中在具体使用场景行使数据安全自决权来落实。[16]

我们也需要注意,数据的人身属性和公共属性在安全权益上也具有一定的一致性。社会公众总是由一个个关联对象个体组成的,对个体安全权益的侵害如果不加制止,也必然会对其他个体进而对群体造成侵害;对社会公众安全权益的侵害同样也会伤及属于该群体的个体。

总之对数据安全权益的保护必须同步纳入数据开发利用的全过程来考虑,与数据价值权益的保护同频共振。

3.1.3数据权益基础设施

通过数据权益基础设施来保障数据要素的价值权益和安全权益。文献[3]详细研究了数据权益基础设施,要点是:在数据产品化确权解决数据产权关系基础上,系统梳理了数据分配关系。依托可信数据空间建设关联对象“数字空间”,建立数据相关主体的权益分配机制,从而构建起数据权益基础设施,保障数据主体价值权益、安全权益,使数据要素价值释放既体现效率,也促进公平。兹不赘述。

3.2技术封建主义?

我们梳理了数据相关方的数据权益,包括价值权益和安全权益,并基于数据基础设施对数据相关方的数据权益加以落实。我们还需要进一步讨论数据的规模性和整体性特征而必然导致的数据集中形成巨型数据处理者(巨型平台)的额外权益。巨型平台拥有因数据集中和数据边际效用递增的价值剩余和租金转移,能够形成无形资产垄断。

塞德里克·迪朗(Cédric Durand)写了一本书叫《技术封建主义》,认为现在的资本主义正在向一种新型的封建制度转变。[17,18]

迪朗认为,网络空间正在成为新的“领土”,网络空间链接的各种终端能够采集的数据正在成为“领土”上的资源。所有的平台企业,都在试图通过构建多平台的平台体系与配套的终端体系,来占有更多的网络“领土”并攫取数据,而在数字“领土”的内部,用户经受的是自动化的算法治理。也就是说,对社会互动的控制现在被置于算法控制的逻辑之下:我们每个人在社会互动中形成的数据不断成为算法优化与决策的“养料”,而社会互动又在被算法的结果“操纵”。在封建化的数字“领土”上,买家和卖家(数字服务的使用者和提供者)都无法享受正常市场中的任何选择,而受平台算法的左右。

我们还是通过导航APP来直观解释,看看网约车的例子。对网约车司机而言,显然对平台具有依赖性,不可能在多个平台间三心二意——虽然平台不一定强制要求“二选一”,但是平台的算法治理会迫使司机忠诚于自己,因为不聚焦在一个平台上积极抢单,司机无法获得更多机会——司机不得不被动接受平台推荐的客户,如果不按照要求提供服务,还将受到算法的制裁。对于网约车用户而言,尽管表面上看有对于多种车型、价格的选择权,其实一切都是算法规定好了的,一旦司机抢单成功,用户只能被动接受算法决定的服务和价格。同样,平台也通过算法不断给予一些“优惠”“补贴”等来维持用户的忠诚度。

巨型平台成了新的社会组织结构,它们用数字技术来控制人们的生活。一方面平台利用了买家和卖家的数据,另一方面平台用这些数据获得了对于数据提供者的控制权。这种控制是不公平的。资本主义生产关系是对具有人身自由的劳动者榨取剩余价值,不尽相同的是,这种平台化的数字“领土”对劳动者的控制,劳动者更具有依附性,这更接近封建的租佃关系,平台上的买家和卖家更像是佃农,而平台更多地在隐形收取数据租金。巨型平台因数据的规模化和整体化形成数字“领土”,因边际效用递增而拥有日益递增的无形资产,可以通过租金获得更多的收益。

在具体的租金转移机制上,迪朗谈到了知识产权租金、自然垄断租金、无形资产的级差租金和动态创新租金四种形式。知识产权租金主要指:核心企业(巨型平台)基于知识产权(专利、版权、商标)的垄断而产生的租金,这体现了核心企业对生产要素的直接控制;自然垄断租金主要指:核心企业可以依靠对整个产业链的严格控制来获得更多的利益,反映的是核心企业在全球分工中对直接生产者的控制;无形资产的级差租金主要指:无形资产规模报酬接近无穷所带来的收益,反映的是无形资产的特性;动态创新租金主要指:核心企业依靠不断积累的产业链上的数据进行持续性的创新,不断获得新的租金。

不少学者都直接认定了用户活动与价值和剩余价值生产之间的直接关系,即用户的“免费劳动”正以无酬的形式,在为平台创造剩余价值。用户实际上是工人,巨型平台靠用户的“免费数字劳动”为生。但是,相较于不断重复“平台在剥削用户”这种逻辑,迪朗的四种租金转移机制,揭示了更复杂的事关数字经济运行的社会关系,涉及平台、用户、外包的生产者、依赖平台无形资产的各种主体间的关系。四种租金既有正向激励作用,包括知识产权、动态创新,特别是充分发掘数据规模报酬递增的特性,更大发挥数据要素价值。同时租金也有负面封建作用,数据租金使得巨型平台食利者化,数据处理者、数据来源者、数据使用者沦为佃农,会改变创新的方向。一旦租金的逻辑成为主导,就会出现“用于保护和扩大数字地租控制权的投资优先于生产性投资”的局面,这实质上改变了平台经济的活力。

迪朗指出了在这种技术封建主义中,我们得到的将是一个被私人控制的公共空间,公共资源被私有化。另一方面,迪朗的技术封建主义框架将国家排除在外,假定了国家是弱小的,主权被“分割”给众多技术霸主。这是值得我们注意的。

对于我国的数据新质生产关系构建来说,需要结合我国的具体情况,认真思考平台垄断的特性、平台租金转移的机制,以及平台对“操纵社会互动”的巨大权力的掌握所带来的特殊问题。同时必须充分发挥国家在维护社会公平正义上的特殊作用,既充分尊重平台对于数据规模化、整体化的不可或缺性,充分发挥平台的动态创新能力,又坚决抑制平台的过度垄断和超级寻租,避免平台的食利者化。这样才能克服数字经济发展的弊端,从而让数据要素真正促进新质生产力的健康发展。

3.3“数据财政”?

关于数据生产关系的另一个偏向是所谓“数据财政”。

“数据财政”概念来自所谓“土地财政”。近20年来,地方政府通过盘活土地资源,实现了经济高速发展。当前,“土地财政”已经难以为继,“数据财政”则应运而生。支持者认为,“盘活政府数据资源,建立数据财政”的时机可能已经到来。和土地不同,数据不会越用越少,并且数据本身会日益增加,因此盘活数据资源,建立“数据财政”可能是政府数据资源开发利用的有效手段。

“土地财政”本身就利弊共现,被人诟病,争议不断。所谓“数据财政”如何汲取这个前车之鉴呢?这点业界并没有考虑清楚。

简单将数据要素去和土地要素类比并不妥当。数据要素和土地要素有根本不同的特性,这点我们已经反复指出,那就是数据要素有关联对象。从数据要素与土地要素的差异来看,有利方面是数据可再生、无穷尽,边际效用递增;不利方面则是权益多元,不可打包。不仅一般数据不能“一揽子授权”,公共数据也同样不可“一揽子授权”。公共数据中绝大多数都涉及主权属性、人身属性,同时是个人数据、法人数据等。公共数据的授权运营还在探索之中,数据确权还在探索之中,等等。这些都决定了“数据财政”还远不是一个确定和可行的概念。

同时,“数据财政”还有叠加“巨型平台”的风险,包括两者有意或无意的合谋,形成平台对用户和数商的剩余价值和数据租金的榨取。如上节所述,本来政府作用应该抑制平台垄断和寻租,“数据财政”可能反而形成合谋垄断和寻租。

这并非空穴来风。日前,中国审计署发布《中央部门单位2023年预算执行等情况审计结果》,其中提到,4个部门所属7家运维单位未经审批自定数据内容、服务形式和收费标准,依托13个系统数据对外收费2.48亿元。根据审计署报告,按要求,各部门应该按部就班地向社会开放其掌握的全国性政务和公共数据,以降低社会公众获取成本。但一些部门的监管不严,所属系统运维单位利用政务数据违规经营和收费。[19,20]

公共数据取之于民,用之于民。公共数据的开发利用,应以降低社会公众获取成本为主,而非以政府部门盈利为导向。在公共数据的开放利用中应遵循普惠原则,“放水养鱼”,而不能急功近利,抬高成本,“竭泽而渔”。应当让公共数据普惠地为社会所利用,广泛地投入到数据要素市场中,广泛地应用于经济社会生活中,培育和壮大数商,带动市场主体的繁荣,保障数据主体(数据来源者即关联对象)权益,做大数字经济蛋糕,才能形成源源不断的税源,这才是数据财政应有之义。

3.4数据个体所有制与数据共有制

我们研究了数据的整体特性,数据的规模经济和范围经济,数据在规模性和范围性上的效用递增,因此,数据的平台化是必然趋势。我们通过对数据基础设施的研究,数据要素化、数据价值化必然依赖数据基础设施,数据基础设施本身就是基础平台。数据的平台化又必然产生巨型平台,并围绕平台形成生态化。

要避免“技术封建主义”,必须充分发挥国家在维护社会公平正义上的特殊作用,既充分尊重平台对于数据规模化、整体化的不可或缺性,充分发挥平台的动态创新能力,又坚决抑制平台的过度垄断和超级寻租,避免平台的食利者化。

数据的整体性、规模性和范围性,数据的平台化和生态化,特别是数据的边际效用递增,数据相关主体又都在为数据的整体性做出贡献,这些事实上就意味着数据的某种共有属性。我们认为这可以理解为一种数据共有制。

一方面,我们知道数据关联对象(数据来源者即数据主体)拥有对涉私数据的决定权,尽管这种个体决定权并非物权意义上的所有权——我们论证了,数据本身涉及多元主体,不能确权,能够确权的是基于关联对象权益让渡后的数据产品——但是这确实是一种对于自身数据的控制权、自决权,这就是某种意义上的数据个体所有制。因此,我们可以在对单条数据决定权、控制权的意义上来理解单条涉私数据的个体所有制。另一方面,从数据整体性和价值效用递增的意义上,数据又不仅仅是一条条的单条数据,而是因整体性才能价值化的数据整体,因此,我们可以在此意义上来理解整体数据的数据共有制。

我们必须深刻理解数据个体所有制和数据共有制的辩证关系。正是因为数据的四大属性,数据既有人身属性又有公共属性,在此基础上才有价值属性,数据就既是一条条的个体决定的单条数据,又是这一条条数据集合起来形成的整体数据,只有两者辩证统一起来,数据才能真正价值化。单条数据本身尽管个体控制,但是如果不加入到数据整体中,就不存在嵌入数据产品这回事,也就无所谓价值;数据整体如果不是由一个个的个体对一条条的数据进行授权和权益让渡,数据整体也无法构成,数据产品和数据价值化也不存在。我们提出的数据产品化确权和数据基础设施建设,本质就在于将数据个体决定权和数据整体性结合起来。也正是通过一整套数据基础设施,以及其支撑的数据基础制度体系,就将数据个体所有制和数据共有制辩证统一起来了。理解这种辩证统一对于理解数据新质生产关系至关重要。

3.5数据新质生产关系

我们在数据四大属性(主权属性、人身属性、公共属性和价值属性)基础上,已经论证了数据相关主体(主权国家、社会公众、数据处理者、数据来源者、数据使用者等)各自的数据权益,包括价值权益和安全权益,特别是我们论证了这些权益的一致性,也就是说,相关主体必须要在处理好各自权益的同时,密切协同一致,才能真正让数据要素价值化、价值最大化,从而促进新质生产力发展。而怎样让拥有各自权益的数据相关主体协同一致起来呢?一方面需要数据基础设施的支撑,更重要的是要在这种支撑中发挥数据基础设施(特别是其中的数据权益基础设施)作为数据新质生产关系的作用,统筹协调相关主体的相关权益,落实好数据产权关系、(狭义)生产关系和分配关系。

3.5.1数据产权关系

数据产权关系的基础是数据产品化。我们已经论证,对于涉私数据,数据本身不能确权,而只能通过数据产品化,借由关联对象授权的同时进行的权益让渡,而对数据产品进行所有权的确权,并进而通过数据产品化和关联对象的权益让渡,而对嵌入数据产品的来源数据进行用益物权的确权,借此也就明确了数据相关主体的产权关系。[6,9,10]首先,数据产品开发者获得数据产品所有权;其次,嵌入数据产品的来源数据的提供方(数据生产主体、价值载体等数据处理者)获得数据的用益物权;最后,关联对象(数据来源者即数据主体)的权益体现在获得使用便利和获得权益返还(包括一次分配和二次分配)。[3]

数据产权关系的关键是数据主体性。关联对象作为数据主体,对数据处理拥有知情权、决定权,因此在产权关系上是关键性的因素。数据主体的授权和让渡才是数据产品化的关键,也才是数据处理者(包括数据产品开发者和来源数据提供者)获得数据相关权属的关键。关联对象不应是被动者,而要在数据产权关系中成为主动者。我们通过数据权益基础设施的关联对象“数字空间”来实现这点,实现“数据以人为本”,这也是落实数据个体所有制。[3]

数据产权关系的核心是数据共有制。我们知道了数据的规模经济、范围经济和边际效用递增特性,也知道数据的整体性特征,这事实上意味着数据在一定意义上的共有关系。必须全面梳理数据四大属性和相应的数据相关主体的权益,在充分考虑数据处理者、数据来源者权利基础上,还必须充分考虑数据主权属性和公共属性所相应的主权国家和社会公众的权益,并通过数据税收等二次分配方式体现相关权属关系。

3.5.2(狭义)数据生产关系

(狭义)数据生产关系的基础是数据基础设施。数据产品生产过程依赖于数据基础设施,并通过数据基础设施而实际上规范了数据相关主体在生产中的相互关系。数据相关主体通过数据基础设施平台,能够使得数据“找得到”“供得出”“流得动”“做得值”“分得均”“用得好”“保安全”。[3]

(狭义)数据生产关系的关键是数据产品开发者的主体性。数据产品开发者是数据生产的发动机,是数据生产活动的灵魂。通过数据产品开发者的主体性,激活数据产品的主体性,并进而赋能来源数据以及相关的数据平台,使得整个数据生产体系纲举目张。数据产品开发者是首要的创新主体,是首要的价值创造者,是数据价值化的核心贡献者,其面向应用场景,才使得数据价值属性得以实现。

(狭义)数据生产关系的核心是数据规模效用递增带来的数据相关主体权益的一致性。不管是数据处理者,包括数据产品开发者、来源数据提供者或者数据基础设施平台,还是数据来源者(关联对象),自利与利他有一致性,因而各方实际上可以共同努力,让数据贡献到数据的整体性、规模性、范围性之中,让数据在公共属性中更好发挥对各自的自利性,发挥对自身、对公众的更大价值。

3.5.3数据分配关系

数据分配关系的原则是既要体现效率,也要促进公平。“数据二十条”[4]明确要“建立体现效率、促进公平的数据要素收益分配制度”,指出:“健全数据要素由市场评价贡献、按贡献决定报酬机制……探索个人、企业、公共数据分享价值收益的方式……通过分红、提成等多种收益共享方式,平衡兼顾数据内容采集、加工、流通、应用等不同环节相关主体之间的利益分配。”“更好发挥政府在数据要素收益分配中的引导调节作用。逐步建立保障公平的数据要素收益分配体制机制,更加关注公共利益和相对弱势群体。加大政府引导调节力度,探索建立公共数据资源开放收益合理分享机制,允许并鼓励各类企业依法依规依托公共数据提供公益服务。推动大型数据企业积极承担社会责任,强化对弱势群体的保障帮扶,有力有效应对数字化转型过程中的各类风险挑战。不断健全数据要素市场体系和制度规则,防止和依法依规规制资本在数据领域无序扩张形成市场垄断等问题。统筹使用多渠道资金资源,开展数据知识普及和教育培训,提高社会整体数字素养,着力消除不同区域间、人群间数字鸿沟,增进社会公平、保障民生福祉、促进共同富裕。”

数据分配关系的基础是前述数据共有制的数据产权关系。依托数据权益基础设施,保障数据相关主体的价值权益。既要“促进劳动者贡献和劳动报酬相匹配,推动数据要素收益向数据价值和使用价值的创造者合理倾斜,确保在开发挖掘数据价值各环节的投入有相应回报,强化基于数据价值创造和价值实现的激励导向”[4],也要兼顾数据主体(关联对象)、数据使用者的价值权益,同时还要兼顾主权国家和社会公众的权益。

数据分配关系的关键是保障数据主体及数据使用者的数据价值权益。在一次分配环节,依托数据权益基础设施,通过对关联对象数字空间被调用的流量等进行计量,以平台返利或数据产品合约等方式来落实数据处理者对数据主体及数据使用者价值权益的一次补偿。一是可信数字身份认证平台作为公共服务平台应提供无偿服务。二是政务数据管理平台作为关联对象“数字空间”的管理者,也应提供无偿服务。三是财政供养的公共部门,无论其作为数据采集者,还是作为公共数据产品的服务提供者,都应对外提供无偿服务。四是数据产品开发者应建立对数据主体按调用频次或流量付费的机制。这可以通过嵌入数据产品中的关联对象授权机制实现,即在与关联对象的授权协议中体现出来,在授权同时,关联对象获得相应收益。五是作为来源数据提供者的数据处理者也应向数据主体(关联对象)付费——这可以体现在数据产品开发者与来源数据提供者以及数据主体的一揽子协议中。六是作为价值载体的数据处理者,包括公共数据运营平台,应计量数据主体及数据使用者的流量贡献并建立定期向数据主体的返利机制。[3]

数据分配关系的核心是更好发挥政府在数据要素收益分配中的引导调节作用。既要体现效率,也要促进公平,特别是要更加关注公共利益和相对弱势群体,防止和依法依规规制资本在数据领域无序扩张形成市场垄断等问题。国家要通过对数据处理者中的大型数据价值载体(特别是巨型平台)根据数据量收取数据税,通过国家税收形式对数据价值权益进行二次分配,以保障公共利益,并向数据来源者、数据使用者进行二次价值补偿。

3.6“重建个人所有制”

数据生产关系要成为适应数据新质生产力的数据新质生产关系,最终是要实现马克思所说的“重建个人所有制”。

马克思在《资本论》第1卷第24章第7节《资本主义积累的历史趋势》中指出:“从资本主义生产方式产生的资本主义占有方式,从而资本主义的私有制,是对个人的、以自己劳动为基础的私有制的第一个否定。但资本主义生产由于自然过程的必然性,造成了对自身的否定。这是否定的否定。这种否定不是重新建立私有制,而是在资本主义时代的成就的基础上,也就是说,在协作和对土地及靠劳动本身生产的生产资料的共同占有的基础上,重新建立个人所有制。”[21]

数据主体对数据的决定权即数据个体所有制和数据共有制之辩证统一所体现出来的数据生产资料的共同占有和数据的个人自决,在此基础上形成的数据新质生产关系,以及承载这个新质生产关系的数据基础设施,能够最好地体现数据的人民性,最好地诠释在新时代中国特色社会主义市场经济条件下建立数据个人所有制,即重建马克思所倡导的个人所有制的伟大实践。

注释:本文数据、信息两词通用。数据(侧重形式、能指)和信息(侧重内容、所指)相统一,可以通用。

[1]董学耕. 数据基础设施论纲——关于数字空间、数据空间、数据资源体系、数据基础设施等基本概念的系统性梳理. https://mp.weixin.qq.com/s/Gocv0dq3tIRhXewNFuPAug

[2]董学耕. 数据基础设施论纲Ⅱ——海南关于数据共享和开发利用的实践路径. https://mp.weixin.qq.com/s/FtLC-S8XT3w40VTz_PLTug

[3]董学耕. 数据基础设施论纲Ⅲ——数据权益基础设施. https://mp.weixin.qq.com/s/EcS6ZRcMBen_DqcBq76BAA

[4]中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见. 国务院公报2023年第1号

[5]董学耕. 论数据产品作为数据知识产权的登记和入表. https://mp.weixin.qq.com/s?__biz=MzAxMDI0MTAwMw==&mid=2247537147&idx=1&sn=1d170150691eb6aff5d2054fc200f1a3&scene=21#wechat_redirect

[6]董学耕. 数据关联对象对数据的决定权与数据产品化确权[M]//《用数据点亮智慧之光:海南省数据要素市场建设探索与实践》. 南方出版社,2023:6-16.

[7]董学耕. 数据产品瞬间集成和稳定性的实现[M]//《用数据点亮智慧之光:海南省数据要素市场建设探索与实践》. 南方出版社,2023c:42-51.

[8]董学耕. 数据产品超市——数据产品开发生产、流通交易和安全使用的一体化[M]//《用数据点亮智慧之光:海南省数据要素市场建设探索与实践》. 南方出版社,2023:17-24.

[9]董学耕. 数据要素纳入财务体系的实现路径:数据产品化[J]. 财务研究,2024,(3):3-10.

[10]董学耕.数据从产品到资产到资源的价值化路径. https://mp.weixin.qq.com/s?__biz=MzAxMDI0MTAwMw==&mid=2247540721&idx=1&sn=bcfb3f3c90e5880b58e6d8d40e77ec37&scene=21#wechat_redirect

[11]董学耕. 数据产品所有权的确权登记和入表. https://mp.weixin.qq.com/s?__biz=MzAxMDI0MTAwMw==&mid=2247539832&idx=1&sn=0548a972773531a7d563b69f671b0f98&scene=21#wechat_redirect

[12]董学耕. 数据产品开发与数据脱敏. https://mp.weixin.qq.com/s?__biz=MzAxMDI0MTAwMw==&mid=2247541068&idx=1&sn=fef10d350b16794505d8d1bb45ee2617&scene=21#wechat_redirect

[13]叶克飞. 现代人更需要批判性思维. https://mp.weixin.qq.com/s/3i7V9_F3fiEX1mFHioNgjQ

[14]中华人民共和国个人信息保护法. 中国人大网

[15]中华人民共和国数据安全法. 中国人大网

[16]董学耕.数据关联对象的安全自决权与数据安全的原子化. https://mp.weixin.qq.com/s?__biz=MzAxMDI0MTAwMw==&mid=2247537450&idx=1&sn=ed11aee6f3da40de64f3ca29788c5313&scene=21#wechat_redirect

[17]塞德里克·迪朗. 《技术封建主义》.中国人民大学出版社,2024.

[18]李直. 《技术封建主义》书评:晚期资本主义的悲歌?. https://mp.weixin.qq.com/s/ikwekDfxWQAusWIibTktAQ

[19]审计署.中央部门单位2023年预算执行等情况审计结果. https://www.audit.gov.cn/n5/n25/c10423754/content.html

[20]南都数字经济治理研究中心. 追问四部门利用政务数据牟利2.48亿:公共数据能收费吗?. https://m.mp.oeeee.com/a/BAAFRD000020240721977044.html?layer=2&share=chat&isndappinstalled=0

[21]《马克思恩格斯全集》(第二版)第23卷,第832页

作者简介:董学耕,海南省大数据管理局原局长、高级工程师,研究方向:数字政府、数字经济、数据要素。