数字空间
物理空间(物理世界),由原子组成。
数字空间(赛博空间),由比特构成,由物理的基础设施(数字基础设施)支撑。
数据:从物理空间到赛博空间的映射。物理世界的元素映射到赛博空间的数据。
物理世界的元素x即数据的关联对象或关联物。
数据=f(关联对象或关联物)
记为:d=f(x)
f为映射,d为数据。
自变量x(物理世界的元素)的集合属于物理空间。
因变量d(数据)的集合属于数字空间(赛博空间)。
关于同一个物理元素x的不同映射所得的不同数据的集合构成关于x的数字空间,记为Sx。
Sx={f₁(x), f₂(x), f₃(x)…}
例如个人数字空间(x为个人)、法人数字空间(x为法人)。
关于x的数字空间是以与x相关的各种(映射)数据对x的多角度描述,形成对x的画像,进而构成与x的数字孪生。
数据空间
数据空间是更大的概念。
各种物理元素对应的数字空间的并集构成数据空间。
数据空间具有内部结构。
第一类内部结构:根据物理空间元素属性对数据空间元素赋予范围结构。
根据物理元素的范围,有各种范围的数据空间,例如某地域的数据空间,某行业的数据空间,等等。因此,数据空间具有行业结构、地域结构。
例如,关于x的数字空间就是数据空间的子集,对x进行画像。因此,数据空间具有个体性结构。
第二类内部结构:根据映射的逻辑关系对于数据空间赋予业务结构。
各种不同的映射f之间的关系构成数据关系。
映射f带有业务逻辑,各种映射之间的关系代表各种业务逻辑关系。
以上两类结构是对数据的说明和标示,可以据此形成数据字典(元数据)。
带有范围结构和业务结构的数据空间就是数据资源体系。
数据基础设施
数据基础设施是数据资源体系的核心。
根据范围结构,特别是业务结构,对数据空间进行梳理,也就是对数据资源体系进行梳理,形成的基本范围架构和业务架构,就是数据资源体系下的数据基础设施。强调的是“基本”和“架构”,其具体含义只能来自物理关系和业务逻辑关系。
基于物理关系和业务逻辑来构建数据基础设施。
公共数据空间,“公共性”需要相关法规来定义。
政务数据空间,“政务”的定义相对明确。
首先基于政务数据空间来构建政务数据基础设施。
政务的业务基础是“三定方案”。
依据三定方案梳理“职责目录”,代表了业务逻辑,相应的映射f需要信息系统和对应的数据空间来支撑,由此形成“系统目录”和“数据目录”。
以上“三目录”体系作为政务数据空间的元数据,就是数据基础设施的底层架构。
数据的价值在于流通利用。基于“三目录”的元数据(数据字典),用户可以提出数据需求,落实到供给方的责任,由此形成数据“需求清单”“责任清单”,不能提供的数据纳入“负面清单”。由此形成数据“三清单”体系。
其他领域的数据空间可以参照政务数据空间基础设施架构,形成具有互操作性、大范围的数据基础设施体系。
全国范围、全业务的数据空间基础设施,就是国家数据基础设施(NDI)。
数据以人为本
数据=f(关联对象或关联物)
它的逆映射便是:
关联对象或关联物=f⁻¹ (数据)
记为:x=f⁻¹(d)
数据涉及关联对象或关联物。关联对象意指有人格属性的对象(自然人、法人等),相关数据为涉私数据。关联物依据物理世界的属性分两类,一是有人格属性的对象的所有物,二是与有人格属性的对象无关的数据,前者相关数据为涉私数据,后者相关数据为非涉私数据。
数据作为物理世界的映射,反映物理世界的属性。
数据因此具有四大属性:主权属性、人身属性、公共属性、价值属性。
数据,主要是较大范围的数据空间,形成对主权国家的多维、深度描述,与国家安全相关的,主权属性突出,其流通、使用受国家安全限制,不可触碰。
数据具有人身属性,需要落实数据关联对象对数据的知情权、决定权,相关数据只有在关联对象的授权下才能进行相关处理,包括流通、使用。
数据还具有公共属性和价值属性,在数据涉及主权不可碰、涉及人格需授权前提下,需要倡导对数据的处理,包括流通、使用。
数据四大属性的位阶上,主权属性高于人身属性,人身属性高于公共属性和价值属性。
因此,在主权不可碰之外,应当落实“数据以人为本”,即落实数据关联对象(自然人、法人等)对数据的决定权,作为数据公共利用和价值释放的前提。
这是数据基础设施的顶层架构。
“三目录”“三清单”的底层架构和“数据以人为本”的顶层架构,构成海南探索国家数据基础设施建设的基点。
作者简介:董学耕,海南省大数据管理局局长、高级工程师,研究方向:数字政府、数字经济、数据要素。