【稿件来源】南方日报出版社

【人物简介】

赵淦森毕业于英国肯特大学,获博士学位。在英国期间,曾任英国Nexor公司兼职高级安全技术顾问、甲骨文英国(Oracle UK)高级工程师。2008年由中山大学作为海外人才引进,2010年由华南师范大学作为优秀人才引进,现任华南师范大学计算机学院副院长、教授、广东省服务计算工程中心副主任、重点实验室主任等。现任国际信息处理联合会云计算专委会副主席、中国云计算专家委员会专家委员、广东省云计算专委会常务副主任委员、广东省超级计算专委会副主任委员、粤港信息化专委会委员、广东省青年科学家协会常务理事等。

【主要内容】

2017年228日,就广东数据治理、数据安全、数据交易等若干问题,南方舆情数据研究院对华南师范大学计算机学院赵淦森教授进行专访。 

赵淦森指出,广东有良好的基础和优势,有望实现电子政务服务的全覆盖。数据治理的本质是通过大数据这种技术和手段,带来工作能力的突破以及方法的创新,因为有了大数据的支撑,可实现制度、流程、业务等不同层面的创新。

他认为未来数据会像水电一样成为城市发展的基础设施,民生方向的紧迫应用将倒逼数据标准制定和发布,提升政府数据治理,需在思维建立、制度建设和安全立法等方面有所突破。

以“机器人打伞的算法”为例,他解释了“众智”的概念,大数据应用,可以不完全依赖严谨的全处理过程,在特定的前提下,只要能通过侧面数据反映全局并解决问题就可以。同时,他作为高校工作者,建议大数据应用实践的人才可以跨学科、跨专业、复合型培养,通过人才队伍建设加快大数据产业的前进发展。

实现电子政务服务全覆盖广东有良好优势

1到π:去年10月,珠三角国家大数据综合试验区启动建设。综合试验区的建设将给广东带来很多机遇,在信息服务业、软件服务业、移动互联网等雄厚基础上,您认为广东还可以在哪些方面在全国树立示范标杆作用?

赵淦森:很关键的一点,我们拥有良好的基础,基于这个基础我们可做全省范围内的“全覆盖”。如无线网络的覆盖、互联网应用的普及等。广东各政务部门数据化建设已相当完善,下一步就是把治理和服务过程延伸到市民,让广大的市民参与。个人觉得,在国内,如果要做到全民参与、或是多方协同,广东是很有优势的。广东政务有网上办事大厅、电子政务云和电子政务应用系统的建设基础,市民通过智能设备,随时随地登录互联网,使用电子政务服务,可以构建完全覆盖的政务服务和数据治理系统。这些是广东在全国的优势和亮点,而且广东对服务创新和技术创新具有很强的开放性和包容性,能够很快适应各种互联网应用。

数据公开与共享是全民参与数据治理的前提

1到π:广东的改革向来走在全国的前沿,在推行这些全覆盖的过程中,不管行政力量还是全民参与,包括协同力度,就像您说的,与其他省份相比,更加容易落地。大数据在政府治理创新中的作用日益凸显。建立数据思维、推进数据公开共享、管理数据安全,在大数据运用于政府治理的具体过程中,有哪些关键突破点和努力方向。

赵淦森:这是一个认识问题。政府不是没有数据思维。恰恰相反,他们的数据思维是相当明确的,非常清楚这些数据的价值。现在政府部门数据仍未公开,是因为这些部门的数据思维意识太强烈。反向思考这个问题,这些部门具有很强的数据保护意识,他们的数据思维集中在数据的所有权,而不是开放权和使用权上面。同时,很多部门错误把数据的管控权误解为数据的所有权,认为他们在管理的数据就是他们所拥有。这就造成了各个机构拥有很多的数据资源,而不能被我们使用。这种现状的改变,需要我们去努力推动政府具有数据开放思维,让政府在符合法律规章制度的前提下更主动、自愿地把数据共享开放出来。对于一些涉密和隐私的数据,要按着要求做好保护或者处理。在保证满足这些条件的前提下,我们政府应尽量把数据公开、共享,为企业或者个人所利用,实现数据资源应有的价值,对于推动大数据产业前进发展具有很重要的作用;同时,对于推动国家治理和政务服务的创新,实现全民参与,其意义重大。

比如,我想参与到广州的交通治理过程中去,分析广州目前交通现状,通过算法协助优化目前广州交通出行路线和时间规划。但这仅仅是我个人意愿,我没有数据,无法实现。如果交通部门的数据可以公开、共享,我想很多人都愿意为解决我们目前交通现状问题出谋划策,达到前面所说的全民参与的情景。这也说明,数据公开、共享,是全民参与数据治理的一个重要的条件。政府部门通过权力实现治理,但市民可以通过大数据应用参与到治理过程中。政府治理的结果最终会通过数据分析和呈现,得到治理的具体落实情况。

具体应用倒逼技术标准,推动数据应用标准化

1到π:您现正担任广东省数据标准化委员会的副主任委员,您对广东省数据标准化有哪些展望?

赵淦森:针对这个问题,我认为是从具体的应用倒逼技术标准。目前很多标准规划是相当接地气的。比如电子病历的使用,除每个医院自身的数据管理外,还存在着数据标准问题,医院之间的数据不能兼容匹配,这就造成电子病历在医院之间不能互通互用,教育亦是如此,教育数据的标准化和流通,这也是全民关注的事情。因此,与民生相关的教育、交通、医疗等方向的数据标准将会被优先制定完善、先行先试。

1到π:民生方向的紧迫应用将倒逼数据标准制定和发布,实现数据的流通和可交换,这是一种典型的数据治理现象。那么您可以为我们解读一下,数据治理的本质是什么?

赵淦森:大数据是一种技术和手段,大数据带来的是工作能力的突破(原来做不了的现在可以做了)以及方法的创新(不同的方法、更高的效率、更好的结果)。同时,因为有了大数据的支撑,我们实现了制度、流程、业务、方法等不同层面的创新,这些是更为深层次的治理体系和方法。治理模式实现宏观管理到微观治理或者精准管理的转变,如精准扶贫,由于有数据支撑,实现扶贫对象精准化,真正意义上做好贫有所扶;另一个就是制度或者体系的转变,在数据治理模式下,实现更全面的管理或者参与情景,如省人大的“人大代表意见一键通”服务平台,实现市民与人大代表的实时、全方位的沟通,通过人大代表将每个市民的良好建议转交到相关部门,相关部门的跟进过程的信息通过平台可查询,实现人大代表工作透明化,通过互联网+”的形式,推动人大代表行使监督权的转变。

广东数据治理的实践,任重而道远

1到π:大数据手段的利用,在政府工作流程和职能履行等方面会发生一系列的改变,您也为我们举出一系列生动的例子,展现数据治理的本质。您担任过省人大、省总工会等部门大数据项目建设的咨询专家,您认为目前在广东,政府数据治理的现状如何?

赵淦森:坦白地说,广东各政府部门目前存在两种极端,好的很好,差的很差。数据治理触动政府部门内部的业务流程或者业务权限等问题,使得政府工作流程的透明化进一步提升,所以推动数据治理存在一定的部门阻力。在这些阻力存在的情况下,如果一把手数据治理意识很强烈,这个单位就会在数据治理方面走的很前;如果一把手的意识不是很强,那就难以实现。

1到π:除了以上阻力外,您认为数据治理其它方面还有哪些具体困难呢?

赵淦森:目前最大问题是立法和法律赋权。国内在大数据立法方面相对很落后,目前真正意义上的支持政府数据公开的法律只有《统计法》,而且只授权统计局开放政府数据。如果个人发布数据与统计局数据不同,那就是个人数据存在问题,因为个人没有权利发布数据。如交通部门没有法律赋权,不能公开交通数据给广大市民,如果使用行政命令发布,则存在很大风险。由于没有法律制度的支撑,数据的公开与共享就很难实现。

1到π:我们发现,即使是政府数据,部门之间的数据由于职能不一、统计口径不同,可能会存在数据不一致甚至数据打架的情况,您如何看待这种现象?

赵淦森:在数据治理领域,这种存在十分普遍。有以下几个原因:一是现在数据治理需要多部门数据协同运作,数据原本不在一个池子里,由于时间、地点等客观原因,数据采集精度要求以及采集差异性,导致数据本身存在差异,但不影响数据本身的真实性;第二种是数据获取渠道存在差异,受社会条件限制,新生数据变化很大,旧数据不能及时更新,造成新旧数据之间存在差异。

1到π:也就是目前数据差异性是一种普遍的常态。政府数据保持一致性,在数据流通过程中,才能创造出更多有价值的产品和服务。那么目前是否有方法解决数据可能存在的不一致性呢?

赵淦森:由于政府部门之间的差异性,保持数据一致性存在很大难度。目前的解决思路之一是使用权威数据源,比如说市场主体,权威数据源应是工商局的市场主体登记数据;税务数据的权威数据应该是税务局的税收数据等等。权威数据源具有最终的解释权。

在特定使用场景中定义数据价值

1到π:未来数据会像水电一样成为城市发展的基础设施。广东大数据交易中心也即将注册。对于数据资源的估值、确权、定价和交易,您有何建议?

赵淦森:目前我们正在协助省有关部门调研大数据立法问题,特别是数据的所有权的确定,对于数据流通、应用、创新开发具有主要的推动作用,但也是大数据立法过程中最难的一个问题。对于数据的价值评估主要有以下几点方式:一是根据数据产生的成本去计算;二是根据数据潜在收益去估算。但是这是传统商品估价方式,由于数据具有可复制等属性,与传统的商品的排他式持有不同。在流通过程中无法监管数据的复制、删除和利用。我个人觉得上述的估价方式都不太适合大数据价值的计算。可以考虑参考知识产权的形式,在特定使用场景中,来定义大数据价值,可能会更合适些。

制度建设是云安全及数据隐私保护的重要前提

1到π:云计算和大数据等信息技术在推动“互联网+”和国家大数据战略中扮演重要的角色。作为国内较早开发展此方面研究的学者,也是国际信息处理联合会云计算专委会副主席,能谈谈您对云安全及数据隐私保护的看法?

赵淦森:很多安全问题不是技术问题,是制度问题、管理问题或者是应用问题。我们经常说,信息安全是三分技术七分管理。目前的数据信息安全问题是缺乏相应的管理制度,归根结底有一部原因立法问题。从法律角度,数据本身应如何去保护,一旦个人隐私被侵犯时,法律层面如何追责。例如“徐玉玉事件”中偷卖数据者,并没有造成徐玉玉直接死亡,如何追究其责任?目前对于数据信息安全,犯罪成本很低,危害严重,根本原因在于无法可依。

跨学科、跨专业培养大数据应用实践的复合型人才

1到π:数据科学是交叉型学科,这门学科非常注重理论与应用实践的结合,而这方面人才恰是市场紧缺的。作为高校教育者,对于如何协同创建一个“政企产学研”的人才培养平台,为广东大数据应用发展供给合适的人才,您有何建议?

赵淦森:培养大数据领域专职人才,应注意跨学科、跨专业,并结合实践应用培养。大数据作为一种手段,能结合不同专业和应用场景及领域,发挥其本身价值。大数据的应用离不开数学等基础学科,只是目前在数学领域突破很小,但与其他领域的结合应用方面存在很大突破,所以在人才培养过程中,应注意结合基础学科,结合应用场景,培养复合型人才。

1到π:您曾经介绍机器人打伞的算法案例,机器人通过分析周围环境中多数人是否打伞,来确定自己是否需要打伞,这种建模思维有别于传统的数据采集、分析并得出结论的过程,应如何解释呢?

赵淦森:这种思路称之为众智,通过依托他人的智慧和想法,完成你想做成的事情。机器人打伞的算法案例主要是通过感知,提取出大部分人的智慧和想法,按着这种大多数的思维去做,如果大部分人都是理智的,那结果一般是合理的。大数据的处理,可以不完全严谨的全处理过程,在一定的条件下,可以通过侧面数据反映全局并解决问题就可以。

《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版。

(编者注:全文具体表述,以南方日报出版社正式书面出版物为准)