董学耕:数据基础设施论纲——关于数字空间、数据空间、数据资源体系、数据基础设施等基本概念的系统性梳理
时间:2024-01-09
来源:

数字空间


物理空间(物理世界),由原子组成。


数字空间(赛博空间),由比特构成,由物理的基础设施(数字基础设施)支撑。


数据:从物理空间到赛博空间的映射。物理世界的元素映射到赛博空间的数据。


物理世界的元素x即数据的关联对象或关联物。


数据=f(关联对象或关联物)

记为:d=f(x)


f为映射,d为数据。


自变量x(物理世界的元素)的集合属于物理空间。


因变量d(数据)的集合属于数字空间(赛博空间)。


关于同一个物理元素x的不同映射所得的不同数据的集合构成关于x的数字空间,记为Sx。


Sx={f₁(x), f₂(x), f₃(x)…}


例如个人数字空间(x为个人)、法人数字空间(x为法人)。


关于x的数字空间是以与x相关的各种(映射)数据对x的多角度描述,形成对x的画像,进而构成与x的数字孪生。


数据空间


数据空间是更大的概念。


各种物理元素对应的数字空间的并集构成数据空间。


数据空间具有内部结构。


第一类内部结构:根据物理空间元素属性对数据空间元素赋予范围结构。


根据物理元素的范围,有各种范围的数据空间,例如某地域的数据空间,某行业的数据空间,等等。因此,数据空间具有行业结构、地域结构。


例如,关于x的数字空间就是数据空间的子集,对x进行画像。因此,数据空间具有个体性结构。


第二类内部结构:根据映射的逻辑关系对于数据空间赋予业务结构。


各种不同的映射f之间的关系构成数据关系。


映射f带有业务逻辑,各种映射之间的关系代表各种业务逻辑关系。


以上两类结构是对数据的说明和标示,可以据此形成数据字典(元数据)。


带有范围结构和业务结构的数据空间就是数据资源体系。


数据基础设施


数据基础设施是数据资源体系的核心。


根据范围结构,特别是业务结构,对数据空间进行梳理,也就是对数据资源体系进行梳理,形成的基本范围架构和业务架构,就是数据资源体系下的数据基础设施。强调的是“基本”和“架构”,其具体含义只能来自物理关系和业务逻辑关系。


基于物理关系和业务逻辑来构建数据基础设施。


公共数据空间,“公共性”需要相关法规来定义。


政务数据空间,“政务”的定义相对明确。


首先基于政务数据空间来构建政务数据基础设施。

政务的业务基础是“三定方案”。


依据三定方案梳理“职责目录”,代表了业务逻辑,相应的映射f需要信息系统和对应的数据空间来支撑,由此形成“系统目录”和“数据目录”。


以上“三目录”体系作为政务数据空间的元数据,就是数据基础设施的底层架构。


数据的价值在于流通利用。基于“三目录”的元数据(数据字典),用户可以提出数据需求,落实到供给方的责任,由此形成数据“需求清单”“责任清单”,不能提供的数据纳入“负面清单”。由此形成数据“三清单”体系。


其他领域的数据空间可以参照政务数据空间基础设施架构,形成具有互操作性、大范围的数据基础设施体系。


全国范围、全业务的数据空间基础设施,就是国家数据基础设施(NDI)。


数据以人为本


数据=f(关联对象或关联物)


它的逆映射便是:


关联对象或关联物=f⁻¹ (数据)


记为:x=f⁻¹(d)


数据涉及关联对象或关联物。关联对象意指有人格属性的对象(自然人、法人等),相关数据为涉私数据。关联物依据物理世界的属性分两类,一是有人格属性的对象的所有物,二是与有人格属性的对象无关的数据,前者相关数据为涉私数据,后者相关数据为非涉私数据。


数据作为物理世界的映射,反映物理世界的属性。


数据因此具有四大属性:主权属性、人身属性、公共属性、价值属性。


数据,主要是较大范围的数据空间,形成对主权国家的多维、深度描述,与国家安全相关的,主权属性突出,其流通、使用受国家安全限制,不可触碰。


数据具有人身属性,需要落实数据关联对象对数据的知情权、决定权,相关数据只有在关联对象的授权下才能进行相关处理,包括流通、使用。


数据还具有公共属性和价值属性,在数据涉及主权不可碰、涉及人格需授权前提下,需要倡导对数据的处理,包括流通、使用。


数据四大属性的位阶上,主权属性高于人身属性,人身属性高于公共属性和价值属性。


因此,在主权不可碰之外,应当落实“数据以人为本”,即落实数据关联对象(自然人、法人等)对数据的决定权,作为数据公共利用和价值释放的前提。


这是数据基础设施的顶层架构。


“三目录”“三清单”的底层架构和“数据以人为本”的顶层架构,构成海南探索国家数据基础设施建设的基点。


作者简介:董学耕,海南省大数据管理局局长、高级工程师,研究方向:数字政府、数字经济、数据要素。