作者:梅宏(北京大学计算机学院教授、中国科学院院士)
当前,数字经济时代正在开启,这是继农业经济、工业经济之后以新一代信息技术和产业为依托的新型经济形态。实施国家大数据战略、建设数字中国、发展数字经济已成为国家的战略选择。发展数字经济需筑牢“三大基石”。
第一,数据要素市场的建立
数据成为关键生产要素是数字经济时代的主要特征,建立数据要素市场是数字经济发展的前提,数据作为生产要素,高效共享、流通交易构成了数字经济的源头活水。当前,我国数据要素化处于起步探索阶段,有若干问题需在未来制度建设过程中进一步研究,如资产地位尚未确立、权属确权尚无共识、流通交易缺乏规则、利益分配缺少机制、安全隐私难以保护等。数据要素市场培育是一项系统工程,需要统筹、系统化推进,需要做好顶层设计,更需要留足创新探索空间。
第二,数字治理体系的构建
数字治理体系是数据要素市场健康有序及数字经济健康发展的保障,其中,数据治理体系的建设是核心。随着数字化转型的加快,传统的形成于工业社会的治理体系、机制及规则难以适应数字时代社会经济发展的需求,政府监管体系以及国际治理体系均面临诸多挑战,诸如互联网公司垄断监管、金融数字业务监管、网络舆情监管与引导、数据安全和隐私保护、新兴技术管控以及大数据和AI带来的伦理问题等。未来十年将是全球治理体系深刻重塑的十年,需尽快构建适应数字经济发展的数字治理体系。
构建数字治理体系,数据治理体系的构建需先行。数据治理是数字治理的基础,属于数字治理的资源和技术层面。当前,系统化的数据治理框架尚未形成,开放共享、安全与隐私保护、质量评估、价值预测等关键技术远未成熟。作者近年来一直在倡导一个“四三四”模型,从治理主体、治理内容以及治理手段三个维度刻画了数据治理的体系框架。在治理主体上包括了国家、行业、组织三个层次,在治理内容上包括数据资产地位、管理体制机制、促进共享开放、保障安全隐私四个方面,在治理手段上包括制度法规、标准规范、应用实践、支撑技术四项工具手段。
第三,数据技术体系的演进
发展数字经济离不开数字(化)基础设施,离不开信息技术,特别是涉及数据全生命周期的大数据技术的支撑。大数据技术主要涉及大数据管理和处理技术、大数据分析方法以及大数据治理技术等。当前,大数据技术发展面临系列挑战,诸如:如何应对数据指数增长带来的算力性能和能效挑战?如何管理超大规模的数据资源?如何满足大数据高效处理的需求?如何实现多源异构大数据的多模态融合分析与可解释性分析?如何形成系统化的大数据治理框架与关键技术?
未来大数据技术发展将呈现若干重要趋势。从总体来看:技术模式从“计算为中心”向“数据为中心”转型;数据与应用将进一步分离,以促进数据要素化;高能效大数据技术栈是可持续发展的关键;大数据标准规范和以开源社区为核心的软硬件生态系统仍然是发展的重点。在数据管理方面:数据管理正在从面向和限定于单域的孤立服务,发展到跨越空间域、信任域和管辖域的数据共享与协同服务的新阶段,跨域数据管理需要破除“数据孤岛”,促进数据要素的共享与协同,促进数据价值的最大化。在数据处理方面:近数处理成为突破性能瓶颈的重要途径,包括存储上移、算力下移以及分布式计算模式的转变;系统设计需从扩展性优先走向性能优先,需要考虑性能优先的系统设计、领域专用软硬件的支持和新兴的数据处理方法。在数据分析方面:需从单域单模态分析到多域多模态融合,实现广谱关联计算;从聚焦关联到探究因果,实现分析结果可解释。在数据治理方面:基于数字对象架构(DOA)的数联网将成为数字化时代的新型信息基础设施。