现在位置:首页 > 机构介绍 > 领导活动
董学耕:数据基础设施赋能“数据要素×”
时间:2024-04-29
来源:

4月18日,由浙江省科学技术协会指导,未来数商大会组委会主办,浙江省数字经济学会、国脉研究院承办的2024未来数商大会在杭州未来科技城学术交流中心成功举办。大会以“场景突破 乘数而上”为主题,聚焦数据要素市场的制度创新、数据治理、场景应用与生态构建等话题展开研讨。大会首创发布公共数据开放“开元奖”、数商典型应用场景“乘数榜”、首个区级数据要素生态指数,共同发起成立数商产业服务联盟,为构建数据要素产业新生态注入活力。

会上,海南省大数据管理局局长董学耕就《数据基础设施赋能数据要素×》为题发表了主旨演讲。以下根据现场演讲内容整理。

各位专家、各位企业家大家好,我分享一下海南在数据要素方面的思考和实践,题目是《数据基础设施赋能数据要素×》。

要发挥数据要素与其他生产要素的协同、在多场景多主体的复用以及多元数据的融合,需要结合具体产业业务场景将多元数据融合在数据产品中来实现,数据基础设施是基础,数据产品化是关键。

一、数据价值化在于场景化产品化

“数据二十条”中提到建立数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的数据产权制度框架,主要是针对数据处理者的权利,但数据有另外一项权利,即数据来源者的权利。

从国家法律法规来看,《数据安全法》中对数据的开发、数据的处理活动做了相关规定。其中核心是把数据要素的特性做了明确,数据是具有主权属性、人身属性、公共属性和价值属性的。现在都讲数据价值,但数据价值利用和变现不能对抗前三种属性,这非常重要。

《个人信息保护法》规定个人对其个人信息的处理享有知情权,这是知情同意原则。此外还有决定权,即数据处理者处理个人数据的各个环节,需要经过个人的授权同意。且很多情况下,要重新授权、单独授权。所以个人对于数据的决定权高于数据处理者的三权。

从数据来源者角度,我们把数据来源者定义成数据的关联对象,数据关联对象可能是个人、企业、法人。有关联对象这一特征是数据要素和其他要素完全不同的地方,数据本身难以确权,因此我们强调先探讨应用,后说确权。

数据需要分类,分类的一个重要维度是依据数据关联对象进行分类,包含非涉私数据和涉私数据两类,涉及个人和法人的数据是涉私数据,这部分要尊重关联对象对数据的决定权,其在应用场景中要实行一次授权、一次使用。使用涉私数据,必须经过关联对象进行授权,授权不能提前授权,只能在使用场景中。因此,数据开发利用需要进行产品化。

数据确权路径是通过产品化来实现,通过数据权益在数据产品中对碰、让渡、获取和实现而确权。数据产品化则必须在一定的安全域中,海南建设了这样一个安全域,在安全域中进行各种数据开发利用。数据产品开发者通过购买数据生产者、载体提供者的数据持有权,获取数据加工使用权,开发数据产品,通过在具体场景具体使用中关联对象在线授权(行使数据决定权并获得使用便利)获得关联对象的权益让渡。成千上万的使用者每次使用时各自授权让渡其数据关联者的权益,从而实现数据产品开发者对数据产品的完整权益拥有,即获得数据产品所有权,从而也拥有了数据产品经营权,这就是数据产品的确权过程。

二、如何破解产业数据流动难题

我们知道产业数据流动非常难,如果公共数据还有“以共享开放为原则,以不共享开放为例外”的原则,那对于企业数据、行业数据和产业数据来讲没有原则可遵循,也无明确规定。需要靠大家的自律、积极来共享数据。因此,针对产业数据,一是要恪守数据不出域的要求,此要求针对所有数据,只要涉及私权的数据,都要恪守该原则;二是数据资源的收益机制尚未建立,数据资源持有者不愿将持有资源跟社会或业界分享,积极性不足。

数据怎样才能供得出?这是待解决的问题。在数据不出域、可用不可见的前提下,各个单位的数据如果都不出域,该问题便无法解决。这就要求要扩大安全域,在更大的安全域里,对各企业、各单位的数据进行数据产品的开发、融合,最终通过数据产品形式,在关联对象的授权下、在使用场景中透出服务。

数据怎么流得动?海南在实践中,是通过公共数据授权运营的模式,兼顾安全和公平竞争,采取了公开招投标的形式,中标企业成为海南公共数据授权运营方。运营方依托政府的公共安全域建设了运营平台——数据产品超市,在数据产品超市中,通过政府和企业双轮驱动,打造“建设+运营+移交”模式。数据的开发生产、安全使用、流通交易,都基于如此公共基础设施来实现。此外,大量的数据使用场景是数据交互,并不是数据直接交易,数据产品的所有权并不需要发生变化,但数据产品在平台上可以产生大量的数据交互性应用。

公共化基础设施需制定全生命周期规则体系。数据怎样能用得好?需把公共数据、超市数据、社会数据融到超市数据中,建立一套元数据基础设施,包括系列公共数据及社会数据目录等,将目录融合到数据产品超市中,通过样例数据、脱敏数据来进行数据产品开发,形成相应服务。

此外还要解决分配问题、权益问题,需要建立价值化的基础设施,此方面海南省目前在全国是唯一探索了直接对数据产品的所有权进行确权的省份。通过对应用场景中最终产品的所有权确权,再反推各种来源数据所形成的数据交互价值。同时,海南也对数据产品的估值做了探索。估值探索非常重要的是需要大量的案例支撑,如果没有大量的案例便无法用市场法、收益法等对其进行估值,对此,我们做了一个评估案例指导手册。

总结起来,海南建成三个层级基础设施:一是元数据基础设施,即数据到了数据产品超市,不管是公共数据还是行业数据、企业数据,进入超市后一定要有目录、清单,要有对数据的解释,才能够有效地应用此类数据。核心是解决单位内或中心化的区域内的数据共享、开放及其价值释放的问题。二是数据公共化基础设施,包括可信数据空间、数据产品超市、扩大安全域、实时性与确定性网络等,核心是解决数据如何从私有域走向公共域,破解“数据不出域”的矛盾。三是数据价值化基础设施,即要有数据确权、估值、资产化、价值化等等一系列的一套体系,解决的核心问题就是数据价值的确认和变现。这样便是我们提的数据基础设施,与数字基础设施是两回事。

聚焦产品化探索数据资源的收益机制,首先要通过数据产品化进行确权,产品化的确权是在应用场景中,在最终价值变现的环节能够实现价值化,这是价值化的前提。二是对数据产品进行资产化,在数据产品资产化过程中需要有相应的数据基础设施支撑,此类数据产品的稳定性很重要。数据价值会随着时效性衰减,因此,一定要保证数据产品是瞬间集成,用的是最鲜活、最现实的数据,且具有稳定性特征,才能够真正确权和资产化。三是通过最终产品的确权,通过合约方式,蕴含在数据产品里的各种API、各种来源数据,实际上也获得了价值,这种价值虽然不对它做所有权确认,但实际上是一种用益权,也就是使用权。我们期望数据并非一开始就被视为资源、资产或石油等,而是根据最终使用场景和产品确权后,数据被确认为具有价值。数据来源的多样性也带来了可计量和可收益的特征,可以视为一种用益权的入表。

三、怎样赋能“数据要素X”

数据基础设施需要分布式复制以构建互联互通、安全可信的数据空间,包括地域、行业和跨境节点。复制过程是进一步扩大安全可信域的过程,这个对安全可信空间的复制过程通过确定性网络+联盟链+零信任机制实现。高确定性网络具有低时延、低抖动、零丢包等特征,支持算力互通和数据产品的瞬间集成。因此,可以在全国甚至跨境范围内实现更大的安全域,并支持关联对象授权以使数据产品提供服务。

通过以上方式发挥公共数据和公共数据基础设施的作用,赋能产业数据空间,让行业和产业数据进入安全可信的空间进行交互。由于企业间缺乏信任,我们建议采用区域中心化与大范围分布式联盟链相结合的方式,其中区域中心化的数据公共化基础设施需发挥重要作用,提供技术背书和信任监管背书。同时,公共数据还需发挥引子、佐证和可信背书的作用,为参与数据产品开发的市场主体提供可信支持。公共信用数据和身份验证数据作为公共数据,由政府为企业间供应链的协同做背书,因此公共数据基础设施具有重要作用。

在赋能产业发展方面,我们通过产业数据产品超市机制,建立一个产业数据产品超市的安全可信空间,来带动产业的应用,发挥数据要素×的作用。

举例,海南在激发市场主体进入政务数据市场的例子中,通过利用海南省数据产品超市,把建设政务信息化项目变成各个部门谋场景,学习浙江建立需求场景,需求清单、场景清单、改革清单等。把需求场景发布在数据产品超市上,由市场主体提前开发成数据产品,政府先试用后购买服务,以此方式带动数字经济发展。

应用场景谋划案例方面,如海南做了服务企业全生命周期的产品,现已上架60多款产品,服务企业从谋划、开办,直到运行过程中的财务、法律服务等等,形成了数据要素×服务的赛道。

比如电子印章产品,现阶段企业的电子印章是通过数据产品超市上的公共印章平台,由政务数据、公共数据为它做支持。该产品并不会发生交易行为,数据产品的开发、电子印章的开发,进入数据产品超市后产生大量服务,企业可以用包月、包年及每盖一次章交一次钱的方式来产生产品的收益。

应用场景拓展方面,医疗健康是海南比较有特色的应用,因为除了跟国家医保局有合作之外,海南的博鳌乐城允许境外最新的医疗器械、医疗药品可以同步上市,我们也做了真实世界临床数据的试验,这样的数据应用开发以后,来反哺药械开发商。

总结,这次两会政府工作报告里面提到健全数据基础制度,大力推动数据开发开放和流通使用。我们认为这句话非常精彩,数据要开发才好开放,不是说简简单单地把数据放出去,而是要通过开发成数据产品然后开放,再流通和使用。

我简单汇报一下海南的思考和做法,非常感谢大家,谢谢。