【稿件来源】南方日报出版社

【作者】蓝云 

人物简介】

        周宏仁2003年5月担任国家信息化专家咨询委员会常务副主任至今,专注于国家信息化的战略研究,负责主持了许多重大课题研究,为我国信息化推进中面临的前瞻性、战略性、全局性问题出谋划策,为国家信息化战略和政策的制订做出了重要贡献。期间,兼任联合国信息与通讯技术工作组高级顾问2008年9月起担任北京邮电大学经管学院院长。

         撰写的《信息化论》为全球第一部全面研究和论述信息化问题专著;《信息化概论》作为“普通高等教育‘十一五’国家级规划教材”主编“庆祝中华人民共和国成立60周年重点书系”的《中国信息化进程》连续主编了2010-2016年《信息化蓝皮书:中国信息化形势分析与预测》。

【主要内容】

         2017年2月24日,南方舆情数据研究院对国家信息化专家咨询委员会常务副主任周宏仁就“数据治理话题进行了专访。周宏仁 从大数据的本质和大数据发展的条件切入,阐释信息化催生的数据产业如何推动工业社会向信息社会的变革和转型,以及中央和地方政府发展大数据产业决策意志和政策制定的重要性和必要性。

         周宏仁认为,数据的可让渡性和可获得性是数据产业发展的前提,衍生的问题包括:数据资产的概念,数据产权的确认(立法或者法规)、数据开放、数据交易和定价、数据保护、隐私保护、数据管理权属等等,都是发展数据产业的基本前提条件,而政府数据的开放对实现数据的可让渡性和可获得性是一个极好的示范。

 大数据技术正在改变着传统的治国理政模式。建议广东依托国家大数据综合试验区建设,在数据资源开放共享、行业应用、工业大数据、产业集聚发展等方面先行先试,推动大数据应用和产业健康快速发展。

数据不是信息化的副产品信息化的本质是数字化

《从1到π》编写组(以下简称“从1到π”):周宏仁是广东省大数据行业和南方舆情数据研究院的老朋友了。在我们去年11月份主办的“大数据应用及产业发展大会”上,您作为大会主嘉宾第一个登坛,做了《培育数据企业,发展数据产业》的精彩主题发言,为广东省建设“珠江三角洲国家大数据综合试验区”、发展大数据产业和推进政府数据治理鼓与呼。

党的十八届五中全会提出大数据发展战略,国务院发布《促进大数据发展行动纲要》,习近平总书记在第三十六次集体学习中提出拓展经济新空间,强调以数据集中和共享为途径,建设全国一体化的国家大数据中心,大数据产业迎来重要的发展机遇。您认为,进入互联网20多年来,我国大数据发展的现状或基础条件如何?

周宏仁:回答这个问题要从以下三个方面分析。一是认识问题的本质:信息化的本质是一场数字化的革命。从数字化信息发展至数字化业务,再发展到数字转型,信息化对人类社会的影响和冲击不断强化和深化。信息化的结果是打造了一个与我们生活的“物理世界”相对应的“数字世界(网络空间 ) ”,我们在物理世界的一举一动,几乎都会在数字世界有所映射。信息化自身也在经历一个数字化、网络化、智能化的迭代,互联网正在向着物联网和全联网发展,打造一个人、机、物智能互联的世界。信息化的直接结果是数据量的急剧增长:计算、网络、数据、软件无处不在。这种现象在农业社会、工业社会都是不曾有过的。

数据看似信息化的副产品”,随着数据量的日益增大,人们开始认识到,数据不是副产品,而是重要的“正产品”。数据流带来了人流、物流、资金流和信息流,加快和加深了人类对物理世界的认识和认知。这个世界每时每刻在发生什么,人们在想什么、做什么、要什么、不要什么、喜欢什么、不喜欢什么,…,会越来越多的反映在数据之中。 

人/机博弈,智能化的机器人可以战胜人类,其技术基础就是对人的行为逻辑和行为方式进行大数据分析,用统计规律和人进行博弈并获胜。如同历次技术革命一样,大数据技术的持续发展有可能使传统的政治、经济、社会、文化、军事和科技活动发生重大变革,带来经济社会的转型,历史就是这样具有相似性。

二是我国发展大数据的现实条件:我国信息化的发展已经导致了一个数字世界的形成,规模还不小。IDC估计,2020年中国的数据总量可能会占到全球数据总量的40%,这是因为中国有13亿人,9亿部智能手机,7.3亿网民,此外还有难以计数的各行各业、机关学校、企事业单位的信息系统,等等。中国数据积累的速度,和中国信息化的发展速度一样是惊人的。

现在讲发展和应用大数据,并不是说我们原来的系统里的数据没有被利用,而是说这些数据的边际效益远远没有发挥,还有巨大的潜力可以被全社会挖掘利用。例如,政府的税务系统和淘宝的电子商务系统,除满足国家和地方的税务数据和淘宝的电子交易处理的需求之外,在对国家经济活动的运行分析和预测方面同样可以发挥巨大作用。

大数据的应用和发展有四个基本条件:数据的可获得、可利用(或以某种条件—付费,签约、交换等等);数据模型,即对需要解决的物理世界的现实问题有科学的模型描述;算法,求解模型的计算方法;软件,可以在计算机或者计算机网络系统中自动搜寻、获取数据,并按模型和既定的算法完成数据的分析计算,最后将计算结果呈现给用户,实现数据可视化。

大数据的存在是数据产业发展的必要条件,但不是充分条件。数据模型、算法和软件随应用的复杂性不同而差异极大,科学性很强,严格地说,需要数据科学和数据技术做支撑。此外,大数据种类繁多,有数字的大数据、文字的大数据、图片的大数据、语音的大数据、视频的大数据,还有各种各样组合的混合型大数据,不同的大数据类型,其模型、算法,软件差异极大,需要数据科学家和工程技术人员假以时日、孜孜不倦地去研究、开发和市场化。因此,大数据的利用和产业发展,是一个伴随信息社会的发展而发展的百年进程,就像工业时代制造业的发展经历了数百年的不断发展和进步一样,不能指望一蹴而就。

三是我国大数据的发展:近年来,我国大数据的发展掀起了一股热浪,对于大数据重要性的认识是提高了,中央政府和地方政府对大数据都很重视。这是一个很大的收获,也是认识上的一个很重要的进步,对于中国大数据的发展和信息化的发展,都很重要。

在大数据的利用方面,很多企业都有一些脚踏实地的,很好的尝试和追求,值得鼓励和支持。只有尝试了,才知道问题的复杂性,才能进一步提出发展大数据的方方面面的科学和技术需要,逐步走进大数据科学技术和产业发展核心。当然,社会上也弥漫着对大数据的浮夸和炒作,对此,我们必须保持科学的、清晰的头脑,不被忽悠。

“千里之行,始于足下。大数据产业的发展是百年大计,却也是一日千里,不可以听之任之。我们需要有针对国家和地方经济社会发展紧迫需求的,符合实际的,由浅入深、由简单到复杂的发展战略、规划、策略和一系列相应的政策举措,来支持大数据产业和科学技术的发展。特别是推动数据科学的发展,培养数据科学家,更是一个百年大计。信息化越往高端发展,所需要的科学技术支撑就越多,大数据、智能化、人工智能的发展,都是如此。这一点,我们必须有清醒的认识。

 

政府应该在数据开放上做出良好的示范动作

        1到π:广东是最早推动大数据产业应用和发展的省份之一,2014年3月即在省级层面成立全国第一个大数据局。去年10月,广东省正式启动珠三角大数据综合试验区建设。您认为综合试验区建设将会给广东带来哪些机遇和影响?应该如何发力,哪些方面有望努力成为全国的亮点?

        周宏仁:综合试验区建设对广东而言,是一个推动大数据发展的极好的机遇。既然是试验区”,就可以对一些复杂的,对推动大数据产业发展有重要意义的,政策不清晰或者战略不明晰的、需要探索和回答的紧迫问题先行先试,取得经验,从而达到推动全国大数据产业健康快速发展的目的。

        广东历来是全国创新创业最活跃的地区之一,很多新思想、新方法、新事物都在这里生根、发芽、成长。希望广东省能够依托国家大数据综合试验区建设,在数据资源开放共享、行业应用、工业大数据、产业集聚发展等方面先行先试,大胆探索,盘活数据资源,激发创业创新活力,推动大数据应用和产业健康快速发展。这些方面都很重要。

        数据的可让渡性和可获得性是数据产业发展的前提,也是“试验区”首先应该关注和试验”的问题。与可让渡性和可获得性相关的、及其衍生的问题包括:数据资产的概念,数据产权的确认(立法或者法规)、数据开放、数据交易和定价、数据保护、隐私保护、数据管理权属等等,都是发展数据产业的基本前提条件,也是需要回答的紧迫问题。广东历来走在全国改革开放的前沿,市场意识很强,社会接受程度很高,创新意识也很强。在这些问题上,应该动员地区和全国的智慧,大胆创新、试验、示范。

        解决“数据的可让渡性和可获得性,关键是各利益相关方的协调。目前存在四种数据所有权:个人或者家庭所有、工商企业与事业单位所有、政府部门所有,以及企事业或政府数据中涉及私权的混合型数据所有权。利益分配结构相当复杂,需要妥善处置。政府部门数据、工商企业与事业单位数据中,都含有个人数据或者其他企事业单位的数据。这些数据,如果要可让渡”的话,一定要与涉及的个人或者企事业单位达成某种契约,以确保让渡”的合法性。让渡和获得数据,需要有法律、法规做支持,才能做到法治、有序。这一点,试验区可以大胆地试验和探索,寻求突破。

        政府数据开放对实现数据的可让渡性和可获得性是一个极好的示范,这也是近年来全球广泛开展的“数据开放运动的深层次原因。政府是全社会公共信息的最大拥有者,数据量非常可观(可能占全社会数据总量的25%左右),政府数据的开放对数据产业的发展起到巨大的推动作用。

        当然,政府数据开放,也不是简单地说开放就可以开放,也要先解决可让渡性和可获得性问题。例如,有可开放的、有条件开放(使用)的、不可开放的三大类;对于可开放的、有条件开放(使用)的公共数据,也有收费、有条件收费(商用)、不收费三类;还要制定可开放的、有条件开放(使用)的公共数据的清洗标准,使数据脱敏、脱密,以保护个人和企事业单位的隐私和其他利益。

        因此,政府数据的开放,需要做大量的准备工作,推动数据产业的发展,是公共利益所在,政府责无旁贷。试验区可以立即着手,参考国际经验和通例,结合我国和广东的实际情况,制定可行的政策和策略,试行相关的收(免)费规范,做出公共数据可让渡性和可获得性的试验和示范。这一点,无论就广东或者就全国而言,意义都很深远。

 

数据治理是技术革命,也将是一场意义重大的政治变革

        1到π:的确,近年来包括广东省在内,各级政府部门在致力于治理能力现代化建设提高政府服务能力方面,大数据技术正日益成为重要的工具和抓手。您在政府应用大数据技术提升服务效能、提高治理能力方面,有什么建议?

        宏仁:这个问题的关键点在于,政府应当如何利用自己和社会的大数据,实现国家治理的信息化和现代化。

        传统治国理政模式是由政府研究、制定、提出、执行各种国家和社会需要的政策、战略、法规和计划等等,然后由全社会,包括各个政府部门、企事业单位、直到每个老百姓,负责执行和落实。尽管政府在制定各种政策、战略、法规和计划等等的时候,也会展开各种调查研究,听取各方的意见和建议;在付诸执行后,也会了解社会的反应,但是由于时间和技术的局限性,政府对社会的治理,基本上是一个政府下达指令、企业和公民执行的过程,是一个缺少及时有效反馈环节的“开环”过程。

由于网络空间日益成为物理世界、现实生活在数字世界的全面的映射,网络空间因此成为政府迅速、准确地把握国情、市情、民情的一个不可或缺的手段。利用网络空间,政府可以构造一个治国理政的反馈系统,完全改变传统的治国理政模式。

在网络时代,政府发布命令,全社会执行的传统治国理政的模式是不可能继续走下去了。政府需要利用信息化这个强有力的工具,使政府的政策和举措,在出台之前先广泛征求、准确把握民意;出台之后获得执行情况的反馈,适时地进行再调整。这样,政府治国理政的过程,就由一个开环的、政府下达指令而公民执行的过程,变为一个闭环的、公民执行并不断反馈的过程,这就是一个公民和政府互动、参与治国理政的过程,一个民主政治的过程。

民主不仅仅只是一张选票,更是公民真正的参与国家治理的过程。数据治理是技术革命,也将是一场意义重大的政治变革。

具体到广东省,广东省的网上办事大厅做得比较成功,走在全国的前列,广东省的电子政务走过了数字化、实现了网络化,正在向着智能化的方向发展,为广东省进一步实现政府治理能力的现代化准备了很好的条件,数据资源的准备无疑也十分充分,为大数据的决策应用奠定了重要的基础。

现在可以立即着手的,是充分利用全省网上办事大厅所积累的大量数据,有计划、有步骤地实现全省省情(市情、民情)和重大事件的分区、分时、分类的实时采集、整理和报送,就省委、省政府(市委、市政府,县委、县政府)最关心的事项提供数据和信息支持,把反馈”的内容和渠道先初步建立起来。第二步,再提高一个层次,对各种数据进行分析,根据需要,对省、市、县三级的决策提供支持。全省网上办事大厅的数据,是非常宝贵的数据资源,是广东省全省多年资源大量投入、领导者和参与者辛勤劳动所形成的宝贵资源,不能仅仅停留在为民办事、为民服务这个方面,除了要逐步地为决策服务外,还要清洗、开放,供广东乃至全社会的经济社会发展服务,以换取更大、更多的经济社会利益回报。

扶植数据企业,政府应有所作为

        1到π:您曾提到,大数据应用的发展最终是推动大数据产业的发展,也必须依赖大数据企业的发展。广东本土拥有大量优秀的软件服务企业、互联网企业,在智慧城市、工业互联网等建设上处于全国前沿,在此基础上,广东如何更好地培育数据企业、发展数据产业、打造数据产品,在全球物联、互联中创造商业价值?

        周宏仁重点是要培育一批真正的数据企业,特别是龙头企业。企业的发展主要靠企业自己在市场上打拼,政府的角色主要有两个:一个是用战略、政策、法规、标准、规范,创造一个好的数据企业发展的环境,让企业有劲能使;另一个是培育数据企业的典型,为其他想进入、想创业的数据企业的发展起到一个示范作用。

        在数据企业发展的初期,政府的规制不能过严,否则有可能将创造力扼杀在摇篮中;但是也不能过宽,以免引起社会的不满和不安。从这个意义上讲,政府的角色需要把握好。

        扶植数据企业对数据产业的发展非常重要。包括:如何定义数据企业(早期应该严格定义,以免鱼龙混杂,干扰数据产业的发展,例如,数据企业应以数据为主要输入,以数据产品或者数据服务,或者二者兼有,为企业的主要输出,即产品);从哪些方面对数据企业给予扶持(除了相当于软件企业的政策之外);制定相关的标准、规范和政策等等。例如,在公共数据开放方面,可以优先向试验区或者产业园的数据企业提供公共数据,让这些企业在涉及公共数据开放的相关问题上(如定价、收费、清洗、服务等)进行试验、试点、制定标准规范,吸引和鼓励传统企业转型为数据企业,用心打造龙头数据企业、形成全社会的示范效应,通过数据企业发展数据科学和技术、引进和培育人才等等。

        要鼓励数据企业在社会上、市场上拿到有用的大数据。目前的数据源主要有企事业单位,政府、互联网和金融等企业、公共平台等,当然,还可以考虑国外、国际数据资源。实际上全社会的数据资源确实不少,只是企业不容易拿到。为此政府的工作必须做在前面,即让数据可让渡、可获得,要警惕一些政府不愿意在这些问题上下功夫,只是把推动数据产业的发展看做一种短期行为,力求在任期内取得政绩”,使大数据的发展始终停留在概念的炒作和社会舆论的忽悠上,更严重的是,政府大量的投入,却没有取得真正的经济社会效益,浪费了可贵的资源,这是很可惜的。

 

数据商品,“确权”是开展数据交易的前提

        1到π:近期贵州、浙江等地相继都成立了大数据交易中心。数据作为资产,您如何看待它的所有权问题,而其作为商品,将如何估值、定价和交易?

        周宏仁大数据交易中心是推动数据市场形成的一个很重要的尝试,成立之初,创意是好的,后来逐步形成全国跟风,不管地域大小,也不论有没有可交易的数据基础,到处都在成立所谓的大数据交易中心,产生了很多盲目的跟风或者炒作,这个就背离了原来的初衷。

        任何商品或服务的交易,必须建立在所有权的基础之上。在数据交易中心,出售数据的一方,如果不是数据的所有权方,或者持有合法数据所有权方的委托证书,是不能提出进行交易的。谁是所有权方,必须有国家或地方政府出具的合法的证明文件,检查这个证明文件就是大数据交易中心的义务和职能,否则后面的交易都是不合“法”的。因此,大数据交易中心首先应该在这方面进行研究和试探,在当前情况下,只有建立“确权”的规则、法律和制度,然后才有可能启动和推进数据交易活动的健康开展。

        数据资源是发展数据产业的前提。数据资源开发的主要形式,就是构建各种不同功能、不同形态的信息系统。构建信息系统,过去是为相关业务活动的运行、管理、决策服务,今后更有可能以采集、累集各种信息资源,以掌握数据资产为目的,构建各种信息系统。因此,信息系统建设的观念会有很大的转变。

        在经济学意义和法律意义上,必须研究和承认数据在一定的情况下是一种资产,即“数据资产”。数字化的数据的产生经由信息系统的建设而实现,需要创新和大量的投入,包括资金(技术、设备)和劳动力的投入,这种投入常常相当可观。无论国家的金关、金税等重大信息系统工程,或是如腾讯、百度、淘宝的企业信息系统,其投入都非常可观。这些信息系统的终极产品就是其所积累的大量数据。显然,不能说这些信息系统的软硬件设备是资产,而其中的数据却不是资产。

        数据既然是资产,就一定有产权问题,必须承认“数据产权”。原则上,谁投入信息系统的建设,使数据变成资产,谁就应该拥有这份数据资产的所有权,即拥有相应的“数据产权”。个人对于在自己的智能终端和其他数据终端中所有的专属数据,也可以申请拥有数据产权。

        就宏观而言,数据产权对于保护国家的数据资产和信息安全非常重要。目前,中国数字化数据总量占全球数据总量的比例已经很高,由于中国是一个人口大国和世界第一互联网大国,中国的数字化数据总量居全球之冠只是一个时间问题。

        “承认数据产权”和“保护数据产权,长期而言对中国有利。“数据主权”的提法不易界定,而“数据产权”和“知识产权”一样,可以界定,且易于被国际接受,也可以作为保护国家数据安全的一个武器。保护“数据产权”,有利于数据产业发展。国家需要制定“数据产权法”,设立“国家数据产权局”。数据资产的拥有者,可以向国家数据资产的行政管理部门申请承认和保护其数据产权。不难想象,未来数据产权的拥有者在数量上一定会远远大于知识产权的拥有者,数据产权管理和保护的工作量将非常之大。

         既然数据是资产,就必须解决资产的定价问题。不同种类、不同性质的数据资产,价格一定有所差异,甚至差异很大。一般而言,投入越多,数据作为资产的价值就越高。数据也可以由市场定价,由供求关系定价。无论如何,数据资产一定会有价值。一旦数据资产有了定价,数据资产作为一种社会财富的地位就确立了,人们(包括政府和企业)以往建设各种信息系统投入的资本存量,就可以变现成资产。这一点,对全社会而言,意义重大。数据资产有了定价以后,对中国的GDP将产生巨大的贡献。

        为了支持数据产业的发展,原则上国家政策应该鼓励数据开放,但数据开放需要有条件。数据开放不可能是无条件的。过去几十年,信息资源共享始终不能实现,一个重要原因即在于数据资产是有价资产,在一般情况下不可能实现共享。政府拥有的数据资产是利用公共资源开发的,原则上属于全社会所有。但是,政府数据开放也不意味着完全的、无条件的免费开放,而要看是向谁开放、使用后是否产生商业价值、是否涉及公共安全、个人隐私等等因素。只有在确认了上述问题之后,数据开放才有可能真正实现。

        上面讨论的还只是狭义的数据产业。广义的数据产业是一个完整的、与数据相关的产业链,涉及的范围更广,包括数据的采集、处理、分析、传播、利用、服务、技术等等,产业链很长,极具经济价值,因此可以提供巨大的市场空间。无论如何,我们不难看出,数据产业是一个极具发展前途的新兴产业,决不能失去这个战略机遇,一定要抢先一步,占领先机,力争在国际上主导数据产业的发展。

 

推进制定数据标准和数据立法,切实保障数据安全

        1到π:为更好地推进数据资源的释放和开放共享,您认为在大数据领域需要制定哪些数据标准?为保障国家安全、网络安全、数据安全和个人隐私保护,在推动过程中需要在政策立法方面进行如何完善?

        周宏仁:数据是各行各业或者个人在各种信息系统的使用中所产生的,信息系统的设计者需要制定各种各样的数据格式和标准。就大数据而言,非格式化,或者说非标准化的数据居多。在大数据领域,主要的问题是对大数据进行分类,进而研究不同类型大数据的分析和处理技术。不同行业的大数据,在数据格式或者标准化方面可能区别很大,从有利于行业的大数据应用和发展出发,有可能可以通过协商研讨,制定出一些行业的数据标准或规范,供业内参考使用。以行政命令的方式做出数据标准,强制执行,比较困难。

        涉及到国家安全、网络安全、数据安全和个人隐私保护的政策、立法方面的问题还很多。2016年11月7日,我国已经颁布了《中华人民共和国网络安全法》,今年6月1日开始执行,其中第四章“网络信息安全”做出了一系列的规定。当然,网络安全法的落实,还需要做很多艰苦细致的工作。

        在国际方面,最重要的问题之一是越境数据流的管理。这个问题,世界各国都很重视,如何既有利于数据的流动、满足经济全球化的需求,同时,又保证各主权国家的数据产权和数据安全,是一个比较复杂的网络空间国际治理问题,国与国之间分歧比较大。在全球已经网络化的情况下,国家、政府、企事业单位、乃至个人的数据安全都受到极大的威胁,如果没有严格和严密的保障措施,国家和个人几乎无密可保。这个问题,必须引起全社会的重视。

《从1π———大数据与治理现代化》,蓝云编著,南方日报出版社20175月版。

(编者注:全文具体表述,以南方日报出版社正式书面出版物为准)