【稿件来源】南方日报出版社

【作者】蓝云

《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版。

      数据的载体、核心是数字。不管是人类世界、物理世界,还是数字世界,或其他世界,数字犹如一粒粒珍珠,散步在各个角落,有的已经被发现,更多的还没有。串起珍珠的线,是数学规律。没有这些线,就没有现在各种形式的网,就没有现在这个丰富的现实。

      数字来源于人类的现实生活。一般认为,先有物,再有了数。但是人类偶尔会异想天开,主观构造出一些“虚拟数字”,而这些“虚拟数字”又能与现实生活互相映射,最终回馈到现实。不要再拘泥于虚拟、现实的对立关系,在一定的维度,虚拟就是现实,现实就是虚拟。也许在某时某刻,我就是蝴蝶,你就是鱼。很难精准描绘这种“异想天开”,我们只好将之成为天才。

      数学规律的核心目的,就是尽量用简单的语言阐释这个复杂世界。作为“上帝描写自然的语言”,数学是全人类文明的共同结晶。数学还是自然科学皇冠上那颗最璀璨的明珠,是自然科学的根基。它的作用还辐射到社会科学的方方面面。构建公理(公设)–输入变量—-推导演绎——输出结论”模型明确告诉我们,众多理论体系的前提在于公理(公设),如果这组公理(公式)不成立,那么这栋理论体系的高楼大厦就坍塌了。原来上帝也会面临“死”的境界。一切都在真与假、是与非、暂时与永恒间游荡。众多大师推演了多种“公理(公设”,才有现代科学体系。

      数学规律一方面要服从于它自身的超自然规律,另外一方面它服务于人类生活。就像进制或数字符号的形成及传播,都遵循了符合客观实际、融合多方文明、适合日常交流等原则。而这与现在我们常说的治理原则是非常相像的。从政治学、社会学角度重新解释“数据治理”绝非刻意拔高、随意界定概念,大数据与治理现代化有着天然的血脉关系,数字、数学其本身的发展,本身就符合治理的原则。

      通过模型与算法,冰冷的数字与火热的生活有了更紧密的关联。比如说,指数增长法则只是数学性质的一个体现,但其正向、反向作用力非常大。水滴石穿,更何况这滴水日益扩大。非线性、复杂、无限、不循环、动态、高速、分开是这个世界的主流,线性、简单、有限、循环、静止、低速、聚合只是特例。我们尊重直觉,但很多时候直觉是靠不住的。地球“无界有限”的,而宇宙又是怎样,我们暂时还不知道,至少霍金还没有给出明确答案。

      先有鸡,还是先有蛋?至今仍无定论。

      对于阿拉伯数字“0”与数字“1”,这个命题的答案却很清晰。当然这个答案与你的直觉未必一致。是先有了“1”,再有了“0”。在“1—9”流传数百年之后,有了佛教“虚”“无”概念的启发,古印度人才臆造出“0”这个数字。但这并不妨碍我们以“0→1”为标示,代指某一个进程。

      科学已经迈过了0到1”“从无到有”的阶段,接下去是“从有限到无限”“从有到多”的阶段。大数据便应运而生。大数据得天时地利人和而来,摩尔定律是“奶妈”,云计算是“接生婆”,社会的系统性更是给了“准生证”。大数据带来新的科学范式,着重进行“关联”思维,不再要求“因果性”思维。根据物理学 “不确定性原理”“在因果律的陈述中,‘若确切地知道现在,就能预见未来’,所错误的并不是结论,而是前提。我们不知道现在的所有细节,是一种原则性的事情。

      大数据冲击波的总和,可以冠名为“1→π”。圆周率π,是一个无限不循环小数。任何人用圆规三秒钟就能画出一个圆,但这个圆的复杂性超出你的想象。这与地球的特性何其相似。

“从0到1”与从1到π”对比

从0到1

从1到π

有限

无限

循环

循环

简单

复杂

线性

线性

静态

动态

确定

不确定

低速

高速

垄断

共享

唯一

多元

聚合

发散

平衡

失衡

抽样数据

全体数据

因果关系

关联关系

关系

关系

椭圆

信息互联网

价值互联网

 

       “大”是一个形容词,大数据是一个相对的称谓,是一个阶段性的说法,是信息化浪潮中的一朵大浪花。现在大数据还刚刚开始。据测算,2030年每人平均有7件可穿戴设备将联上互联网,到那时我们再来说“大数据时代”才更准确。但是历史不属于等待者、观望者,历史是由先知先觉者创造的。谁先用上新思想、新理论、新概念,谁就是时代的舵手。世界是平的,熨平这个世界的一个推手就是大数据。大数据给了后发区域赶超的机遇。

      大数据有丰富的公共价值,尤其是在中国。它并非只是一个数据领域的概念,通过大数据助推“治理现代化”,有治理成本低、风险系数小、综合效益好等优势。“数据治理”在中国有着广阔空间。2015年9月,国务院发布《促进大数据发展行动纲要》,提出“打造精准治理、多方协作的社会治理新模式”,建立“用数据说话、用数据决策、用数据管理、用数据创新”的新型管理机制。

      计算机1946年诞生以来,七十年来中国人主要是处于学习者角色。但在未来的数字世界的建设、数字生态文明的塑造方面,中国人可以起到更加重要的作用。正如祖冲之计算的π值,在800年时间内都是全球最精确的。广东是中国的经济大省、工业大省,还是网民数量第一大省,改革创新意识浓厚,在大数据的综合应用方面,可以起到排头兵的作用。

      大数据的一大终极使用是人工智能。2016年“阿尔法狗”4比1击败围棋世界人类“第一人”李世石为标志,人工智能有了更高的能力。人工智能会不会全面超过人类?奇点大学联合创始人、谷歌技术总监雷·库兹韦尔(Ray Kurzweil)的观点是,2045年人工智能将会超过人类水平。他说:“我在人工智能领域工作了50年,现在一些新的观点认为,未来的3-5年内,将实现机器通过与人类对话来了解人类的想法。15年后会达到人类智能水平,能够做人类能够做的事情,软件会出现指数级的增长。我们也会和计算机技术不断融合,到2045年它们将超过人类水平,人工智能确实影响到我们生活的方方面面。”他说。

      库兹韦尔指出“2045年它们将超过人类水平”,但他没有公开发布推导过程。按照上述构建公理(公设)–输入变量—-推导演绎——输出结论”演绎法则,我们一起来构建模型,推算一下。

     现实:计算机1946年诞生,2016年在被认为在人类智力的一个最高级阶段的围棋领域,超越人类。现代人的脑容量是1500毫升,原始人是400—500毫升。

     假设:

     1、1946年第一台计算机“智能数”等同于原始人,取均值450毫升;

     2、人类的脑容量进化缓慢,可以忽略改变,取定值1500毫升;

     3、人类的智能分为知识、智慧,以围棋为代表的是知识能力,各个领域的综合知识、复杂领域的判断是智慧能力。知识能力的“智能数”相当于1500毫升脑容量,智慧能力“智能数”相当于3000毫升脑容量;

     4、计算机的“智能数”同比例、指数级增长,从1946年开始。

     推导:

     计算机从450毫升脑容量进化到1500脑容量,70年时间持续指数级增长,可以测算出年进化率为1.733%;

      按上述1.733%推算,从1500毫升脑容量“智能数”进化到3000毫升脑容量“智能数”,需要40.333年。
结论:人工智能2056年全面超越人类。

      这个结果比库兹韦尔说的2045年多了15年。这样的推导当然是简单化、抽象化了,肯定经不起人工智能领域专家的仔细推敲。

      但是我们可以明白,如果我们认同人工智能的指数级增长法则,认可这个世界不会陷入“兴衰交替”“平稳发展”“人类会灭绝”等境界,那么人工智能全面超越人类是大概率事件。

      人工智能全面超越人类,那是否意味着机器人接管人类世界,人类将成为机器人的奴仆?这个问题,也困扰我许久。后来我查询到核爆炸的相关知识,也就释然了。现今人类掌握的核弹头可以毁灭全人类上百次。但是可喜的是,这个世界至今并没有被毁灭,而通过核能发出的电流却源源不断输送到千家万户,造福人类。

      很显然,霍金没有这么乐观。2014年12月,霍金接受英国广播公司(BBC)采访时明确表示:“制造能够思考的机器无疑是对人类自身存在的巨大威胁。当人工智能发展完全,就将是人类的末日。” (蓝云/著)
(编者注:全文具体表述,含数学公式、符号以及脚注等,以南方日报出版社正式书面出版物为准)