【稿件来源】南方日报出版社

【人物简介】

晋彤,毕业于北京大学物理系,拥有超过30年信息产业实战经验。曾在多个技术和咨询公司担任高级工程师、首席架构师、咨询主管、CTO、首席科学家等职务。广州市邦富软件有限公司与广州市云润大数据服务有限公司创始人,目前担任云润大数据研究院首席科学家。大数据专家,为多家公司及数百个各级政府提供大数据技术和战略咨询服务。研究和主持项目方向历经并行算法、神经网络、固体物理、海量数据处理、网络空间安全、体系架构以及软件开发等方面。

【主要内容】

   
2017年38日,就政务数据治理、数据交易、大数据产业发展及政策导向、大数据咨询顾问行业发展等问题,南方舆情数据研究院专访大数据专家晋彤。晋彤作为较早从事大数据相关业务运营的专家,以自己亲身参与的经历,分享了从传统媒体到新媒体的媒体大数据行业的演变、以及关于舆情大数据价值深化的观点。

   
在政府数据治理的进程中,如何构建一个理想的数据治理架构,晋彤从技术和管理两个层面提出大数据技术运用于政府科学决策,并提出结构性解决方案的方法学。

   
在数据交易方面,晋彤建议,从公平性、稳定性和规模性去综合看待,多交易增值产品,少交易原始数据,做好真正面向广泛市场的交易机制,使得数据交易形成一个健康生态圈。

   
晋彤同时呼吁,通过大数据咨询顾问这个角色去推动大数据知识交流及传播理念和方法,有计划地推进相关业务建设。要从战略咨询、业务咨询和架构意识等方面打造这样的专业团队,在发展过程中要规范入门门槛、制定行业职业操守和行为规范。

   
作为一名骨灰级IT人,从IT(信息技术)走向DT(数据技术),面向技术框架改变,晋彤也从知识结构的完善、研发事务的重心等方面对技术从业者的发展提出若干建议。

数字经济的体量会远远大于实体经济

《从1到π》编写组(以下简称“从1到π”):早在十多年前,您就开始研究大数据基础平台,切入大数据产业。就您的认知,目前大数据领域,广东有哪些行业产业相对成熟,还将孵化出哪些新的业态,市场估值前景如何?

晋彤:大数据产业与经济发展水平极度相关,中国目前有三个大的经济圈——京津冀、长三角、珠三角,从目前人才和市场来看,广东有机会进入国内前两大市场,如果要进前一,这要看我们的努力程度和运气。广东发展大数据具备天时和地利。首先,广东有雄厚的工业基础,制造业发达,制造业产生的数据量远大于人为生产的数据,物联网产生的数据体量非常大;其次是电商,电商是大数据应用的前沿,电商交易数据也是大数据应用分析的一个重要方向。第三是政务数据,政务大数据应用是重中之重,目前来看,从项目投入、立项规模来看,政务大数据应用也已在迅速推动发展之中。以上这些行业,无一不受益于大数据技术和应用,这也是我们的经济趋向,相信未来数字经济的体量会远远大于实体经济。

    在我们的生活中,大数据意识和技术也已经迅速地渗透,数字生活在我们的日常中占据越来越大的比例。我们从读报纸到基于网络空间去了解信息,电商购物、上网学习培训、网络直播等等,随着VR技术的兴起,人的整个思维已经跟网络空间结合在一起。数字生活的发展,导致生活选择项越来越多,信息越来越透明对称。基于以上这些情况,可能会有权威数字生活指南这种形态的媒体出现,它可能是一种个性化的应用,引导人们的数字生活。

    工信部和省政府去年指导召开的大数据大会,南方报业是具体承办者之一,大数据大会对广东大数据产业的发展基本定调,政府、企业都会大力推动这一产业的发展。作为圈里面的一员,我希望大家一起来共同努力。

利用大数据技术提升媒体服务能力

1到π:谈一谈您亲身参与的舆情大数据、媒体大数据行业,大数据如何为舆情监测分析服务,以及这种价值如何深化;媒体又如何通过大数据提升内容、渠道和服务能力?

晋彤:媒体有一个很模糊的概念,叫传播影响力,这是一个很重要的指标。虽然很多人在讲,但概念却不清晰,传统媒体的有效到达率究竟是多少,大家都说不清楚。这是因为对于传统媒体来说,缺乏互动以及统计的机制。新媒体出现后,通过媒体大数据,你可以去统计一篇文章、一场活动、甚至一个媒体的传播影响力。当媒体可以通过足够细化的指标对网络数据进行分析,自然就产生了舆情。通过互联网用户行为分析,基于用户画像就可以产生个性化推荐引擎,这可以反过来提升媒体的内容品质、渠道推广及服务能力。随着数据技术的成熟以及数据量的不断丰富,机器可以对每篇文章去进行深度学习,根据学习的结果进行自由文本的生成,这就是写作机器人。就目前来看,机器还不能够进行语言风格的提炼以及承上启下的上下文理解。假若这两者可以实现,并且可以通过数据模型去做人物设定、场景设定,写作机器人也就可以去写小说了。但媒体大数据并不是屏蔽人工操作,中间可能需要人工干预。虽然机器通过学习掌握丰富的数据模型,数据可视化可以从固定数据模型去产生,但数据表现的形式,需要人工干预才能提炼出来。

除了媒体的生产传播,当我们可以使用大数据技术对媒体进行舆情分析的时候,我们就可以将这一技术用于改善政府及企业治理。 这就是舆情大数据、媒体大数据行业的价值深化。

建设统一数据平台避免更多“信息孤岛”

1到π:在国务院发布的《促进大数据发展的行动纲要》中,明确提出建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,逐步实现政府治理能力现代化。您认为从方法学上来看,政府在数据治理的进程中,构建一个理想的数据治理架构有哪些着力点和开展方向?

晋彤:首先是要提供一些技术的方法论,就是你要怎么样去面对一个需要解决的对象,如何去解决。第一,政府的数据并非空中楼阁,它是以大量的过去20多年的软件系统建设为基础,但多年的建设也产生了众多的信息孤岛,这是我们面对的一个实际情况。我们应该沉下心来用大数据的方法把相关数据全部融合在新的大数据平台上,充分利用好之前建设系统产生的数据,暂停建设更多独立的系统平台。第二,建设区域性的政府数据汇聚中心。不管是建设分布式的数据网络,亦或是响应中央的号召,建立国家级统一数据中心。建设区域性的政府数据汇聚中心,可以保证数据的统一管理,确保数据的条块分割是符合政策管理的,这样做的好处是在遇到政府管理改革或者是政府职能部门调整的时候,可以避免很多业务系统要重新设计和开发。第三,建设大数据交易平台,让大数据平台产生新的价值。

其次是管理上的方法学。由政府部门的基础功能驱动产生不同的业务流程和数据,比如税务、社保、民政等等数据。广东政务服务一直走在国内前列,当然我们还要进一步开发这方面的潜力。比如佛山禅城的一门式改革,在思路上已经很超前。基于大数据做业务数据的融合和业务系统的重构可以极大地提高政府办事效率,提升政府服务能力。还有一块是智慧政府决策,通过大数据去分析整个行业、产业的趋势,可以从政策层面去避免上马不合适的项目。比如,政府引入一个电子加工项目可能比较顺利,因为项目本身环保问题没那么突出。但如果引入核电或者垃圾焚烧项目,可能就会出现比较大的抵触。这就需要政府决策去了解老百姓的知识结构、心理结构和其他因素。大数据可以为整个决策提供结构性解决方案,适当避免项目上马后出现尴尬的情况。

多交易增值产品,少交易原始数据

1到π:刚才您提到了数据交易,目前国内大数据交易产业已经起步,贵阳、浙江等省市的大数据交易所都已正式挂牌运营。广东省大数据交易平台也即将注册成立。数据如何定价、价值变现的探索,以及在商业化机制中如何运作,您有何建议?

晋彤:我的建议比较直接,所有的交易都必须具有以下三个特性:一个是公平性,然后是稳定性,还有是规模性。首先是公平性,只要交易双方在不缺乏法律保护意识的情况下进行交易就行,这是自由交易的基础。第二个稳定性。数据的价格难以保持稳定性,因为原始数据一般存在一个确权的问题,另外交易过的电子资料非常容易复制,保护数据可能比版权保护更加困难。所以数据交易,应该不是有形数据的买卖,而是需要通过基础的数据服务技术能力,将数据的原始形态加工成数据的价值形态。数据就像虚拟土地,是交易虚拟土地还是去交易上面长的树和水果呢?我认为应该多交易些树和水果。这就是我的观点,多交易增值产品,少交易原始数据。第三是规模性。广东虽然不是第一个去从事数据交易,但并不意味着我们不能把数据交易规模做到第一。因为数据交易是跨地域的,就像上交所和深交所,并不会每个地方都有证券交易所。数据交易也一样,未来可能会出现相对集中的数据交易中心,去交易全国、甚至全球数据产品。个人认为,只要做好真正面向广泛市场的交易机制,数据交易形成一个生态圈,规模是可以做上来的。

1到π:2016年大数据大会上正式启动珠三角九地市跨区域的国家大数据综合试验区的建设。站在产业发展的角度,从政策保障方面来看,您有哪些建议?

晋彤:一个产业通常都有前瞻性的驱动。珠三角的制造业,要从定制的“制”变成智能的“智”;珠三角这个全世界最大的贸易集散地,要从物流的集散地发展成为包含电商结算等在内的综合平台。从产业发展的角度来看,机会和危机会去驱动这个产业,跳出原有的思维方式,政府应该给产业的变革最大限度甚至是前所未有的支撑。比如义乌,政府给了足够政策扶持它去做小商品市场,最后它发展成为世界小商品交易中心,政策导向对产业的发展是非常重要的。

大数据咨询顾问是行业发展的催化剂

1到π:近年来大数据热度不断升温,因此催生出大数据咨询顾问这一行业。您觉得大数据咨询顾问行业如何定位,在政府企业数据治理过程中,它将充当什么样的角色?怎么规范化?

晋彤:第一,大数据这个行业快速规范的发展,是需要通过专业知识的交流并且需要有计划去推动的。通过大数据顾问这一角色,可以大大提高效率,避免走很多弯路,也可以使得成本大大下降。这就相当于一个化学反应的催化剂,虽然量少但是很有用。另外,大数据顾问也是一个传播使者,向人们传播大数据的理念和方法。第二,大数据顾问并不一定只是计算机编程人才,实际上战略性的顾问咨询非常重要。了解政策方向,了解产业结构,同时了解行业发展,这就属于战略咨询。战略咨询又分两种,一种是通用的战略咨询,就是讲趋势和政策。还有一种战略咨询就是针对行业,掌握行业客户资源,通过业务的深度和发展方向指导我们应该怎么去做。也有些人是具备两种战略咨询的特质。第三,大数据是深度技术性的活,大数据咨询顾问需要有架构意识,这可能更接近于现代的IT产业。在做大数据的组织架构时,也要考虑到效益、吞吐量、扩展性、稳定性、兼容性、安全性等等。架构设计好以后,才是具体的落地实施。

最后,大数据咨询顾问行业必须要规范,需要有能力和水平的咨询顾问去执行大数据的传播和咨询,否则就会出现很多乱象。舆情分析行业已存在这种乱象,我见过有个人在名片上印制“中国首席舆情分析师”。我们要吸取这方面经验教训,尽早制定这个行业的规范。这点可以借鉴国外的律师行业协会,它不是一个政府组织,但有明确的行业协会规范,有入门门槛,对从业者要求也很严格。除了具备一定技能外,还必须遵守职业操守和行为规范,比如对客户数据严格保密,这些都可以在发展过程中逐步完善。

1到π:可以说您是“骨灰级”IT人,从ITDT,技术框架上也会产生哪些变化,或者说将面临哪些技术挑战,我们该如何应对这些转变和挑战?

晋彤:如果大家真的喜欢技术,那就是最好的时代。因为你可以动手,愿意去尝试,出结果、出成绩的概率就大。这是一个纯技术爱好者的亲身体验。

站在从业者的角度,大家要生存,首先需要考量我所在的产业,是处于上升期还是夕阳产业。从IT到DT,个人认为从技术层面来看,应当尽量去做一些逻辑性强、严谨的算法类事务,少去做一些泛泛的、容易被替代的工作。有些工作比如用户界面的整合、接口程序的代码粘合,这些工作量很大,但未来这类工作却会有自动化的方案去替代。目前架构师是非常缺乏的,但随着大数据技术的发展,未来也有很多东西会被云化,像虚拟化、存储管理、数据挖掘等,“云”会帮我们解决架构问题。所以我们需要认清发展趋势,提炼自己面向架构的基本知识。业务的知识,永远不会过时。真正好的技术人才应该是懂业务的技术人才。如果大家对技术还有追求的话,也不妨从计算机层面下沉去接触基础数学、物理的知识,这些将成为大数据计算领域的基础。有助于我们去理解模型的建立、算法的原理以及应用。

《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版。

(编者注:全文具体表述,以南方日报出版社正式书面出版物为准)