【稿件来源】南方日报出版社
【人物简介】
涂子沛:大数据专家,前阿里巴巴集团副总裁,著有《大数据》《数据之巅》。1996年本科毕业于华中科技大学计算机系,2006年获中山大学公共管理硕士学位,2008年获卡内基梅隆大学公共管理硕士、信息科学硕士学位。在美期间,历任软件公司数据仓库程序员、数据部门经理、数据中心主任、亚太事务总监、首席研究员等职务。2014年12月,回国出任阿里巴巴副总裁,主管集团大数据事宜。2016年1月,创建大数据智库,旗下自媒体平台涂子沛频道,致力于将大数据的科技符号转变为文化符号。2012年7月出版《大数据》,2014年5月出版《数据之巅》,两本著作获得高度评价。书中观点被国务院印发的《关于促进大数据发展行动纲要》、浙江省政府印发的《浙江省促进大数据发展实施计划》等文件多次引用。
【主要内容】
2017年2月27日,就广东大数据产业建设、政务数据治理等问题,南方舆情数据研究院专访大数据专家涂子沛。涂子沛与我们分享了大数据在国内应用发展的历程,指出广东发展大数据可以抓住珠三角大数据综合试验区成立的契机,跨地域推动数据整合、流通和应用,做出不一样的成绩。
涂子沛同时指出,数据交易的方向并非有形数据的交易买卖,其本质是一种以数据为基础所提供的服务。对于现在数据过度采集的问题,涂子沛在数据采集合法性、正当性和科学性三方面给出建议。通过数据流通来推动政务业务融合,最终数据联通和共享都将导致几乎所有政府机构的职能重组和流程再造,这也将会是大数据时代组织运行的常态。
涂子沛建议,加强对数据的认识和使用,从国家的层面,从社会的层面,推动到个人的层面,在中国文化里加强数据文化的基因,同时认识到数据是私隐的载体,是一种权利,数据可以产生红利。数据文化、数据权利、数据红利与每一个个体息息相关。
大数据应用发展已经到了蜜桃成熟的阶段
《从1到π》编写组(以下简称“从1到π”):2012年,您出版了中国大数据领域第一本著作《大数据》,之后出版《数据之巅》,深入浅出阐述大数据的基本内涵、意义和现实运用,引领中国社会对大数据战略、数据治国和开放数据的热烈讨论。因此,2013年也被称为中国社会的大数据元年。四年多来,您认为大数据在国内的应用发展是一个怎样的过程,已经发生了哪些改变?
涂子沛:从概念上看,已经到了一个蜜桃成熟的阶段。大数据在精准营销、个性化管理等商业应用方面已有很多开花结果。在政府层面,一方面数据滞后的时间越来越短。以浙江为例,政府在数据的实时处理上有很大的进步。比如在杭州你今天没有扣安全带,实时被抓拍,通过图片及时处理,很快你就会收到罚单。另一方面就是数据的融通。江西正在做全国公安部门物流数据的试点,通过物流数据去跟踪辨别嫌疑人员有没有收发快递,通过这些数据发现逃犯。逃犯可能没想到,发个快递也能暴露自己的罪犯身份。
从1到π:您曾在广东求学、也在广东工作过,能谈谈您对广东大数据现状的认知及看法吗?
涂子沛:广东在大数据领域起步较早,广东是国内首个成立大数据管理局的省份。如今很多省份或城市都跟上了广东的步伐,贵阳、沈阳、上海都陆续成立了大数据管理局。大数据综合试验区建设是第二轮机会,贵阳成立了全国第一个大数据综合试验区,然后是上海、沈阳、河南等也获得批复成立。同时国家还批复成立了两个跨区域的大数据综合试验区——京津冀和珠三角。珠三角大数据综合试验区的成立是一个新的契机,广东可以抓住此契机,跨地域推动数据整合、流通和应用,做出不一样的成绩。
数据交易应以数据服务为基础
从1到π:广东的软件服务业、互联网行业发展在国内具备一些先天的优势。在大数据应用和产业发展方面,刚才您也提到,现在很多省份都在发力,广东面临着压力和挑战。据悉,广东正在筹备启动大数据产权交易中心建设。在大数据产权交易方面,能否给一些建议?
涂子沛:目前国内的数据交易模式都不成熟,对国内很多交易所现行的数据交易方式,我个人持反对态度。
从1到π:您是否觉得现在的这种数据交易行为,或在监管方面有哪些不足呢?
涂子沛:很多在数据领域从事商业运营的公司老板可能曾有这样的经历,常有电话来问,“有全国社保数据,10万块钱要不要”。拒绝了之后的下个月又有电话来问“5万卖给你,要不要”。从10万降价到5万,是因为在过去一个月他已经卖出了多次,如果初始数据购买成本是10万,他流转倒卖2次(每次5万)即可回收成本,第三个月,可能他会打电话来问“2万卖给你,要不要”,如果卖出他即可实现“盈利”。
这个案例反映出两个突出问题:第一,这就是今天数据交易的现况,大量的数据从灰色渠道中流出和交易。第二, 由于数据复制几乎没有成本,数据交易难以被监管。因此,我认为数据交易不是有形数据的买卖。未来我们的数据交易应该以数据服务为基础,基于数据服务去做数据交易。
科学合理收集数据,减少“数据扰民”
从1到π:去年十月份,国家批复广东珠三角大数据综合试验区建设正式启动。在试验区建设的过程中,数据采集除了时效性、实时性,在渠道、手段,以及数据标准的交换等方面,您有一些什么建议?
涂子沛:核心应该是如何更加合理、安全、科学地收集数据。目前,一个突出的问题是过度采集的现象普遍存在。不同的部门重复收集同一种数据,甚至同一个部门因为不同的业务环节也在重复收集数据。今天办事你要填表,过段时间再去办事,又得填表。至于为什么需要这个数据,没有人告诉你原因。过度收集上来的数据没有保护好,受到攻击就泄露出去了,反而成为了一个公民隐私泄露的问题。“徐玉玉案”的爆发,我们应当反思、质疑当下政府和商业机构数据收集体制机制之合法性、正当性和科学性。我建议,对于如何科学合理的收集数据,我们应当尽快出台相应的法规,明确统筹的部门,详尽规定数据收集的目的、类型、流程和使用的权限,抑制过度收集数据。我相信,用法律来约束数据收集的过程,不仅可以提高数据收集的科学性,还可以减轻公民负担、减少“数据扰民”。
数据融通是政府职能改革的契机
从1到π:数据收集后最终要通过数据的流通,来实现业务的融合。在政府应用数据创新社会治理模式的过程中,政府各部门之间各地区之间,数据流通现在还存在明显的壁垒。您认为这些壁垒主要体现在哪些方面?我们可以从哪些方面去推动数据的融通?
涂子沛:壁垒存在的关键还是在于部门利益,现在部门把数据视为权力,一旦把信息数据共享出去了,权力可能就要丧失。之前我从海外回国,落地某市,需要为新租的房子开通水、电、气。整个经历还是有点雷人、催人思考。办理水、电、气等业务的市民服务中心集中了政府的各个职能部门,窗口都是开放式的。我在水务柜台备齐资料、交验办理完毕后,辗转隔壁电力部门柜台,却需要重新复印、交验,资料留底后才能开通电力业务。这就是目前国内大多数政务服务中心的现状,各职能部门的办事员虽然坐到一起了,实现了物理空间上的集中,但是数据联通却非常有限。这往往由于行政力量或是人为的划分,跨部门跨地区的数据难以获取和融通。因此,表面来看,数据联通是一个技术问题,但其实是个政治问题,最终数据联通和共享都将导致几乎所有政府机构的职能重组和流程再造。数据联通,与机构裁减和合并、大部制行政改革,这些都是暗合的。“交数则交权,分家先分数”,将会是大数据时代组织运行的常态。曾几何时,全世界的政府部门都强调分工,大数据时代则要强调融通。为了有效地融通,政府甚至要设立一些新的职位,如首席数据官,统筹领导整个数据的收集、使用和联通工作。深圳的大部制改革,这就是一个契机。
数据是智能世界的土壤,公开应存一定条件
从1到π:从政府的信息公开到呼吁政府数据开放。您觉得信息公开与数据开放的不同之处在哪里?
涂子沛:数据开放和信息公开这是两个完全不同的概念。简单的说,公开是信息层面的,是一条一条的公开;开放是数据库层面的,是一片一片的。公开即告之,是知情权的载体,而数据开放是将原始数据以机器可读的形式放在互联网上,让别人下后载就可以自由使用,它是技术层面的,是为了让社会更好的使用数据资源,推动经济发展和社会创新。例如公共财政公开、官员财产公开,今天很多国家已经不是把一个数据结果告诉大众,而是把整个公共支出的数据细目以数据库的形式放到互联网上,以供大众分析使用。在大数据时代,开放数据的意义,在于让数据这种生产资料流动起来,以催生创新,推动知识经济和网络经济的发展,也可以促进中国的经济增长由粗放型向精细型转型。大数据时代也是对社会关系、个人社会地位的挑战。数据开放是信息自由流动的一个高级阶段。数据如果是开放的,就代表知识是开放的,权力是开放的,为开放社会提供了真正的基础。
从1到π:您觉得政府数据开放的界限应该怎样科学地规划?
涂子沛:关于科学规划,政府数据开放可以设置两个底线,第一,数据开放不危及国家安全,第二,不侵犯公民隐私。除此之外,应该所有的数据都要开放。有些地方已经喊出“缺省型开放”的口号,默认所有数据一旦产生即是开放,如若不开放,需要有专项文件规定。而目前政府数据开放还是基于领导意志的阶段,搞改革、搞试点、搞大数据竞赛,数据即阶段性开放。事实上,数据开放应该是一种持续状态,才能保持开放的意义和价值,或许我们可以通过立法来形成制度性的、系统性的、长期性的数据开放。我们可以朝这个方向努力。
从1到π:南方都市报去年有一篇热门报道,记者花600块钱买到了同事的开房记录,这其中涉及了商业和个人数据的开放,刚才您也提到了,数据买卖的灰色渠道。那么商业和个人数据的开放界限应该怎么设。
涂子沛:现在的问题是“数据失控”,公共数据并没有规范地开放,却在地下渠道中流通买卖,产生不当价值,甚至危及到民众的生命安全。“徐玉玉”事件就是个典型。商业机构数据的泄露,大致有两种情况,第一种情况是内鬼的存在,把数据复制出来,拿去交易买卖;第二种就是黑客攻击,没有确保数据的安全。数据是智能世界的土壤,任何智能应用是基于数据这片土壤上,我们要像保护土壤一样,保护数据、治理数据。
普及数据文化,共享数据红利
从1到π:不止是科学研究,您在实战方面也有丰富的经验,包括您曾经在阿里担任过大数据方面的负责人。互联网企业发展大数据,它一般有怎样的目标、方向,对政府治理与建设有哪些促进的作用。
涂子沛:首先,政府可以借鉴互联网企业大数据应用的经验,推出智能化、个性化、精细化的应用。比如淘宝的个性化页面和商品推荐、腾讯微信基于用户所需的个性化服务,这种个性化服务是建立在源互联网企业收集的所有关于你的数据基础之上,它才能够“猜你喜欢”,把好的商品推荐给你,猜你所需,将你所需的服务推介给你。手机界面是有限的,现在政府APP也可以学习做到服务的智能化和个性化。其次,我觉得未来的公共服务是基于预测的、精细化的公共服务。长期来看,一个城市很多事项是稳定的、变化不大的,根据预测可以规划人力资源配置作出适当调整。比如公交行车路线的合理规划、行政窗口业务办理进度规划等等,通过大数据实时地预测,政府可以考虑公平与效率,更灵活合理地调配人、财、物等公共资源,然后发挥最大化的价值。
从1到π:中国人善于含蓄、模糊以及联想式的表达,您所提倡的是“数先生”,就是主要用逻辑来分析,用数据来证明一些东西的合理性。与国外相比,中国在数据文化方面还是有所缺失或是需要提升的,您在这方面有没有一些建议。
涂子沛:无论是互联网,还是大数据,亦或是云计算,在这一波的技术浪潮中,美国依然是领头羊,是举旗人,但是受益最大的实际上是中国。我们的应用学习能力非常强,在很多方面甚至已经走到了美国的前面。我们所要提升的是在中国文化里加强数据文化的基因,这是必须普及到大众层面的事情。首先是对数据的认识、使用,要从国家的层面,从社会的层面,推动到个人的层面,让个人可以精确地使用数据,使每个人都有使用数据的意识。其次,慢慢地我们还要认识到数据是隐私的载体,它是一种权利。最后,数据可以产生红利,商业机构有了我们的数据,就可以通过我们的数据获得巨大的商业利益,这种数据红利应该跟数据的所有人一起分享。数据文化、数据权利、数据红利都是跟个人相关的。我将在我的第三本书中描述数据的全面应用。
《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版
(编者注:全文具体表述,以南方日报出版社正式书面出版物为准)