【稿件来源】南方日报出版社
【作者】蓝云
《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版。
数据的载体、核心是数字。不管是人类世界、物理世界,还是数字世界,或其他世界,数字犹如一粒粒珍珠,散步在各个角落,有的已经被发现,更多的还没有。串起珍珠的线,是数学规律。没有这些线,就没有现在各种形式的网,就没有现在这个丰富的现实。
数字来源于人类的现实生活。一般认为,先有物,再有了数。但是人类偶尔会异想天开,主观构造出一些“虚拟数字”,而这些“虚拟数字”又能与现实生活互相映射,最终回馈到现实。不要再拘泥于虚拟、现实的对立关系,在一定的维度,虚拟就是现实,现实就是虚拟。也许在某时某刻,我就是蝴蝶,你就是鱼。很难精准描绘这种“异想天开”,我们只好将之成为天才。
数学规律的核心目的,就是尽量用简单的语言阐释这个复杂世界。作为“上帝描写自然的语言”,数学是全人类文明的共同结晶。数学还是自然科学皇冠上那颗最璀璨的明珠,是自然科学的根基。它的作用还辐射到社会科学的方方面面。“构建公理(公设)–输入变量—-推导演绎——输出结论”模型明确告诉我们,众多理论体系的前提在于公理(公设),如果这组公理(公式)不成立,那么这栋理论体系的高楼大厦就坍塌了。原来上帝也会面临“死”的境界。一切都在真与假、是与非、暂时与永恒间游荡。众多大师推演了多种“公理(公设)”,才有现代科学体系。
数学规律一方面要服从于它自身的超自然规律,另外一方面它服务于人类生活。就像进制或数字符号的形成及传播,都遵循了符合客观实际、融合多方文明、适合日常交流等原则。而这与现在我们常说的治理原则是非常相像的。从政治学、社会学角度重新解释“数据治理”绝非刻意拔高、随意界定概念,大数据与治理现代化有着天然的血脉关系,数字、数学其本身的发展,本身就符合治理的原则。
通过模型与算法,冰冷的数字与火热的生活有了更紧密的关联。比如说,指数增长法则只是数学性质的一个体现,但其正向、反向作用力非常大。水滴石穿,更何况这滴水日益扩大。非线性、复杂、无限、不循环、动态、高速、分开是这个世界的主流,线性、简单、有限、循环、静止、低速、聚合只是特例。我们尊重直觉,但很多时候直觉是靠不住的。地球是“无界有限”的,而宇宙又是怎样,我们暂时还不知道,至少霍金还没有给出明确答案。
先有鸡,还是先有蛋?至今仍无定论。
对于阿拉伯数字“0”与数字“1”,这个命题的答案却很清晰。当然这个答案与你的直觉未必一致。是先有了“1”,再有了“0”。在“1—9”流传数百年之后,有了佛教“虚”“无”概念的启发,古印度人才臆造出“0”这个数字。但这并不妨碍我们以“0→1”为标示,代指某一个进程。
科学已经迈过了“从0到1”“从无到有”的阶段,接下去是“从有限到无限”“从有到多”的阶段。大数据便应运而生。大数据得天时地利人和而来,摩尔定律是其“奶妈”,云计算是其“接生婆”,社会的系统性更是给了其“准生证”。大数据带来新的科学范式,着重进行“关联性”思维,不再要求“因果性”思维。根据物理学 “不确定性原理”,“在因果律的陈述中,‘若确切地知道现在,就能预见未来’,所错误的并不是结论,而是前提。我们不知道现在的所有细节,是一种原则性的事情。”
大数据冲击波的总和,可以冠名为“1→π”。圆周率π,是一个无限不循环小数。任何人用圆规三秒钟就能画出一个圆,但这个圆的复杂性超出你的想象。这与地球的特性何其相似。
“从0到1”与“从1到π”的对比 |
|
从0到1 |
从1到π |
有限 |
无限 |
循环 |
不循环 |
简单 |
复杂 |
线性 |
非线性 |
静态 |
动态 |
确定 |
不确定 |
低速 |
高速 |
垄断 |
共享 |
唯一 |
多元 |
聚合 |
发散 |
平衡 |
失衡 |
抽样数据 |
全体数据 |
因果关系 |
关联关系 |
强关系 |
弱关系 |
圆 |
椭圆 |
信息互联网 |
价值互联网 |
“大”是一个形容词,大数据是一个相对的称谓,是一个阶段性的说法,是信息化浪潮中的一朵大浪花。现在大数据还刚刚开始。据测算,2030年每人平均有7件可穿戴设备将联上互联网,到那时我们再来说“大数据时代”才更准确。但是历史不属于等待者、观望者,历史是由先知先觉者创造的。谁先用上新思想、新理论、新概念,谁就是时代的舵手。世界是平的,熨平这个世界的一个推手就是大数据。大数据给了后发区域赶超的机遇。
大数据有丰富的公共价值,尤其是在中国。它并非只是一个数据领域的概念,通过大数据助推“治理现代化”,有治理成本低、风险系数小、综合效益好等优势。“数据治理”在中国有着广阔空间。2015年9月,国务院发布《促进大数据发展行动纲要》,提出“打造精准治理、多方协作的社会治理新模式”,建立“用数据说话、用数据决策、用数据管理、用数据创新”的新型管理机制。
计算机1946年诞生以来,七十年来中国人主要是处于学习者角色。但在未来的数字世界的建设、数字生态文明的塑造方面,中国人可以起到更加重要的作用。正如祖冲之计算的π值,在800年时间内都是全球最精确的。广东是中国的经济大省、工业大省,还是网民数量第一大省,改革创新意识浓厚,在大数据的综合应用方面,可以起到排头兵的作用。
大数据的一大终极使用是人工智能。以2016年“阿尔法狗”4比1击败围棋世界人类“第一人”李世石为标志,人工智能有了更高的能力。人工智能会不会全面超过人类?奇点大学联合创始人、谷歌技术总监雷·库兹韦尔(Ray Kurzweil)的观点是,2045年人工智能将会超过人类水平。他说:“我在人工智能领域工作了50年,现在一些新的观点认为,未来的3-5年内,将实现机器通过与人类对话来了解人类的想法。15年后会达到人类智能水平,能够做人类能够做的事情,软件会出现指数级的增长。我们也会和计算机技术不断融合,到2045年它们将超过人类水平,人工智能确实影响到我们生活的方方面面。”他说。
库兹韦尔指出“2045年它们将超过人类水平”,但他没有公开发布推导过程。按照上述“构建公理(公设)–输入变量—-推导演绎——输出结论”演绎法则,我们一起来构建模型,推算一下。
现实:计算机1946年诞生,2016年在被认为在人类智力的一个最高级阶段的围棋领域,超越人类。现代人的脑容量是1500毫升,原始人是400—500毫升。
假设:
1、1946年第一台计算机的“智能数”等同于原始人,取均值450毫升;
2、人类的脑容量进化缓慢,可以忽略改变,取定值1500毫升;
3、人类的智能分为知识、智慧,以围棋为代表的是知识能力,各个领域的综合知识、复杂领域的判断是智慧能力。知识能力的“智能数”相当于1500毫升脑容量,智慧能力“智能数”相当于3000毫升脑容量;
4、计算机的“智能数”同比例、指数级增长,从1946年开始。
推导:
计算机从450毫升脑容量进化到1500脑容量,70年时间持续指数级增长,可以测算出年进化率为1.733%;
按上述1.733%推算,从1500毫升脑容量“智能数”进化到3000毫升脑容量“智能数”,需要40.333年。
结论:人工智能2056年全面超越人类。
这个结果比库兹韦尔说的2045年多了15年。这样的推导当然是简单化、抽象化了,肯定经不起人工智能领域专家的仔细推敲。
但是我们可以明白,如果我们认同人工智能的指数级增长法则,认可这个世界不会陷入“兴衰交替”“平稳发展”“人类会灭绝”等境界,那么人工智能全面超越人类是大概率事件。
人工智能全面超越人类,那是否意味着机器人接管人类世界,人类将成为机器人的奴仆?这个问题,也困扰我许久。后来我查询到核爆炸的相关知识,也就释然了。现今人类掌握的核弹头可以毁灭全人类上百次。但是可喜的是,这个世界至今并没有被毁灭,而通过核能发出的电流却源源不断输送到千家万户,造福人类。
很显然,霍金没有这么乐观。2014年12月,霍金接受英国广播公司(BBC)采访时明确表示:“制造能够思考的机器无疑是对人类自身存在的巨大威胁。当人工智能发展完全,就将是人类的末日。” (蓝云/著)
(编者注:全文具体表述,含数学公式、符号以及脚注等,以南方日报出版社正式书面出版物为准)