【稿件来源】南方日报出版社

【人物简介】
    邓立邦,数相智能科技有限公司CEO,2004年毕业于中国科技大学。数相科技人工智能客服机器人“小双”研发团队leader。所带团队matview 2017年获Kaggle国际猫狗识别比赛第七名,是该比赛唯一进入前十的中国团队。

【主要内容】
    2017年2月27日,关于人工智能的应用及发展,南方舆情数据研究院对数相智能科技有限公司CEO邓立邦进行了专访。邓立邦介绍了数相科技发布的人工智能客服机器人“小双”。“小双”团队通过识别图片,实现以物种识别为主的人机自然交互。目前已可识别AKC(美国养犬俱乐部)标准分类下的全部256种纯种狗,还有82种其他大型陆上哺乳动物、56种鱼、28种昆虫等。
    邓立邦同时分享了对国内外人工智能发展的看法。在人工智能领域,沉下去做基础性的研究是很必要的。相对与国外来说,国内的很多做法是先找市场需求,直接使用现成的技术成果,铺好市场后再考虑去提升技术,这种方式在人工智能领域容易遇到瓶颈。
    关于人工智能未来发展的趋势,邓立邦认为大数据是人工智能的基础,在很多领域,基于大数据,人工智能做的决策会比人类更优秀。从目前的发展进度看,人工智能一旦具备推理能力,它的进化速度会加快,很可能在五十年内超过人类。

 “小双”是位了不起的“她”

    《从1到π》编写组(以下简称“从1到π”):数相科技日前发布了第一代“小双”,主攻图像分类与识别。你和我们讲讲“小双”是什么吧,应该怎么称呼ta,是他(她、它)?听说ta识别小狗很厉害,怎么做到的?
    邓立邦:确定名字阶段我们进行了较长时间的讨论,人工智能这个领域很大,我们希望能在其中的模式识别这个小方向,做得更专一些,希望能在这个小小的领域里面做到无双,所以就取了“小双”这个名字。目标有点大,但目前正一步一步的往前走。我们是从物种识别,从狗、猫这些常见的动物开始的,起因是生活中碰到了一个问题。去年我带小朋友看宠物展,发现参展的狗非常多,有许多是我们连名字都说不出的,更不要说他们的习性、脾气等特点了。当时我在想,能不能通过人工智能,或者说通过机器学习算法去解决这个问题。然后,我们就开始研究,从刚开始可以识别35种狗,到后来的176种,做到了现在的可以识别全部256种纯种狗,识别准确率也超过了92.39%。目前全球在这一块我们是做得最全的,包括百度和谷歌目前都没有把一个物种的识别做得很全面。我们正和中科院华南植物园合作,通过他们提供的照片样本,让机器进行一万多种植物的识别训练。接下来,我们希望一个物种一个物种,逐步扩大识别物种范围。也许不久,通过“小双”,你随手拍一张物种照片,就可以马上知道包括它的名字在内的有关它的全部信息了。
      “小双”除了普通照片的物种识别外,在其他图像格式数据的分析,例如显微镜下的物种鉴定等也取得了不少进展。这其中包括木材鉴定。木材从国外进口,经过海关时需要抽检,对木材进行切片,送到检验机构,通过专家在显微镜下去进行类别鉴定。这个过程主要是依靠专家的眼睛和经验。我们希望通过机器学习,通过大量的显微镜照片样本训练,让机器完成鉴定工作。目前的切片、送检、鉴定流程非常长。通过人工智能对显微镜下的切片细胞图进行分析,可以在极短的时间里获得识别结果,准确率也很高。
      “小双”最擅长的是解决图像的分类问题。让我们欣喜的是,现实生活中的问题,大部分都可以转化为分类问题,包括物种分类鉴定,人脸、证件识别,也包括我们正在做的情绪识别等。我们的情绪识别技术通过标记好的200多万张人脸照片,提取出脸部72个稳定的特征点。在视频分析中,通过这72个特征点的分布和移动轨迹,将情绪识别出来。

    有强大的学习能力,能分辨物种,更能辨认情绪,有耐心回答你的每个问题, “小双”是位了不起的 “她”。

基础性的研究对于人工智能是非常必要的

    从1到π:你长年在美国搞研究,比较了解美国情况,美国现在的人工智能情况发展怎样?中国与美国相比,在人工智能方面,有哪些优势和不足?
    邓立邦:2016年,我在美国硅谷的一家科研机构进行联合研究。美国在人工智能这个领域的许多研究都很前沿,技术发展水平和应用比中国要领先一些。例如图片自动打标签技术,在美国早已相当成熟和广泛应用,但国内还不多见。美国创业者不少是有技术和研究背景的,他们看重技术,看重产品,看重创新,技术是让他们自豪的事情,所以会追求技术的不断进步。在国内的很多企业,通常是直接拿国外的开源框架或算法,包装成一个产品就去销售了,追求“7天从入门到精通”。美国很多高校,甚至企业,都重视基础研究,特别是基础算法研究,以年,甚至是以10年为单位进行研究。人工智能从五十年代开始到现在已经有六七十年的时间了,现在我们知道的大部分飞跃性进展是许多研究人员长年埋头苦干进行基础性研究的成果。在国内,我们缺乏这些基础性研究,也缺研究氛围,追求快,看重应用,所以只能跟着别人跑,别人做出什么,我们就拿早几年发布的研究成果去应用,这会相当被动。现在国内人工智能很火,也有不少泡沫。快速膨胀的市场没有足够好的技术支撑,泡沫就会破灭。
    在人工智能领域,沉下心去做基础性的理论和算法研究很重要。技术是厚积薄发的,一开始走得慢些不要紧,后面会越走越顺畅。我前不久跟一家获得天使投资的科技企业CTO交流,他们用了三个月实现机器学习算法“从入门到精通”,但也很快出现问题,因为他们用的是一个公开算法,对算法背后的逻辑不清楚,需要修改时,没有算法理论基础,不知道从何改起。算法出现瓶颈,产品性能上不去,销售速度慢下来,投资人和市场的热情也相应的冷下来了。

大数据是人工智能的基础

    从1到π:我们说说另外一只“狗”吧,阿尔法狗,它下围棋赢了人类。我们知道,你也经常下围棋。你怎么评价阿尔法狗?
    邓立邦:谷歌了不起的地方是把深度学习和强化学习结合起来,将落子选择器和棋局评估器结合起来,这是非常了不起的。阿尔法狗的升级版Master也已经在快棋比赛保持不败。至少在这个领域,完全超过人类智慧了。随着模型算法优化,硬件提升,人类已无法跟它抗衡,就像用双腿与飞机赛跑一样。
    阿尔法狗有了相当程度的推理能力,它很多的走法是棋谱里面没有的。在它的开始阶段还需要人去教,一定程度后它就能通过对抗学习,自己进步了。

    从1到π:在人工智能领域,大数据起到什么样的作用和角色?请说说你的理解。
    邓立邦:在人工智能领域,大数据是关键要素,是燃料,没有数据,人工智能模型就跑不起来。伴随数据量增长,模型准确率也会逐步提高。大数据是人工智能的基础,没有大数据的支撑,人工智能也只是个壳,它完全没有思想。跟小孩一样,需要不断获得信息,认知和思考能力才能逐步提高。
    人工智能在国内的可应用场景还有很多,非常值得发掘。例如动物园、植物园的物种识别,商品的识别导购,海关和安检的危险品检测,木材钢材分拣,安防的人脸检测,基于情绪识别的办事窗口满意度分析等等,人工智能可以连接的场景非常多。有一个比较有意思的例子是金融机构给养鸡农户贷款。例如农户要贷款10万元养鸡,农户需要将养的一万只鸡做抵押。这就产生一个风险控制问题,如果农户的鸡出现大规模死亡,就意味着农户的还贷能力出现问题。金融机构要尽早发现,要对这些抵押物,即鸡的数量进行监测,现在的做法是派人下去数。一万只鸡在农场走来走去怎么数得清?如果有100个这样的农户,要数多少天?要多少人去数?我们的人工智能数鸡系统就可以很简单的解决了。在养鸡场装摄像头,通过图像识别辨认鸡,统计数量。具体是对同一时间点的视频画面进行分析,就可以知道养鸡场里有多少只鸡。每半小时合算一次,多次合算进行平均计算就能统计出相对准确的数量了。当数量出现较大范围变动时,系统预警,派人下去现场检查情况。平时监测人员坐在办公室里面看报表就行了。这项技术大大的降低成本,提高可靠性和准确度。
    像上面提到的这些人工智能应用例子,机器之所以能进行判断、预测,前提都是有海量的训练数据。只有经过了大量数据的大规模训练,人工智能的分析系统才能达到实际应用水平。

    从1到π: 您怎么用通俗易懂的方式给大家解释一下什么是建模?或者建模和算法是什么关系?
    邓立邦:建模,实际上是为了更好的理解事物,而对事物进行抽象的方法,把系统内的因果或相关关系描述出来。我们的建筑设计图就是对真实建筑的抽象,是建模。

    跟建模不同,算法是具体的计算方法,我们是用加还是乘的方式去计算,是算法。例如我们要进行木材加工,把整个过程分成原材料分拣、喷漆、烘干、成品分拣四个环节是建模,而其中原材料分拣使用的色差分拣法是算法。

机器人会伪装成人类去竞选总统吗?

    从1到π:对于人工智能的未来,是否会超越人类、颠覆人类,有多种不同意见。你个人的意见呢?
    邓立邦:我对技术一直有好奇心,也很信任技术的未来。从当前的技术进步速度来看,人工智能确实会有具备自主意识的一天。我们碰到过这样的情况,只用狗的背面及侧面照片的进行机器学习训练,机器居然可以从没有见过的照片,从肚子方向拍的照片,认出了狗。它在学习训练的过程中掌握了一定的逻辑推理能力,我们一直认为只有人才有的能力。推理能力发展到一定阶段,它就能自己再学习,而且自我成长的速度,也是我们无法想象的。
    我相信人工智能有可能在五十年内超过人类,奇点很快会到来。涉及机器道德方面的问题我没有去深究,但不受情绪影响,知识面足够广泛,拥有更客观分析能力的未来机器人很让人期待。

    从1到π:美国总统竞选近期是一个热门话题。未来会不会出现机器人具备了自我意识,伪装成人类去竞选总统?它能够利用对大数据的分析去了解民众需要怎样的总统,制定合适的竞选策略,然后大家都把票投给他,这种情况可能吗? 
    邓立邦:完全有可能。有研究表明,图灵测试已对人工智能机器人无能为力了。掌握大部分数据的机器人来做决策,有可能比人类更可靠。美国有一家做耳科疾病检测的智能硬件企业叫CellScope,他们的产品是一个卡在手机摄像头上的小硬件,用户按引导声音放入耳朵就可以进行耳道拍照。通过三百多万张图片进行机器学习训练,他们的机器可以对用户的耳朵疾病进行判断。数据对比结果是,机器的判断准确度已高于人类医生们的平均水平。越来越多以前只有人能做,依靠人的经验判断的领域,在大数据的支持下,机器的决策能力会逐步赶超人类。

从事人工智能、数据分析行业最好是兴趣驱动

    从1到π:南方舆情数据研究院曾请你给团队同事授课,您提到,您在好多年前,自建了一个系统,预测广东顺德当地的天气。现在您还有时间当“义务气象预报员”吗?从您的经历来说,对人工智能、数据分析行业分析者,有什么样的从业经验传授?
    邓立邦:2003年开始,我尝试在业余时间做顺德地区的气象预测研究。经过10多年努力,建立的模型准确率为94.95%(同期政府气象公报发布的数据是晴雨准确度在80%到90%之间)。这项成果让我相当自豪,也为我后来的许多其他研究建立了基础。去年出发去美国前,我把这个业余小项目停了。一是因为时间不够,二是根据国家政策,个人不允许发布天气预报。我觉得政府应当在这些民生公共领域有更多担当,为市民做更多事情。
    从事人工智能、数据分析行业最好是兴趣驱动。只有喜欢,才能长时间坚持,才会在碰到困难时不放弃。人工智能行业能解决很多实际问题,所以我们不妨先分建立一个目标,然后拆分成多个小里程碑,再努力去研究。每个小里程碑的实现,会进一步促发我们继续下去的耐心和兴趣,这样就能进入良性进步的通道。前面提到的天气研究,除了因为好奇,好奇机器是否可以做天气预测,另外也因为我爸是养鱼的,天气预测很重要,也有实际需求,所以可以坚持13年。

《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版。

(编者注:全文具体表述,以南方日报出版社正式书面出版物为准)