阿尔法元完爆阿尔法狗的启示,人类应该向人工智能学习三堂课

人工智能引发的奇迹恐怕早就不再是新闻了,这热潮当然是在去年三月李世乭与AlphaGo(阿尔法狗)的对弈开始广为世人知道。前天(10月19日),一篇Nature重磅论文“Mastering the game of Go without human knowledge”引发国内广泛热议,人工智能再次刷新人们的认识。Google的AlphaGo在AI上取得了又一个胜利:自我学习进化

作者:尹相志  来源:秦朔朋友圈(微信公众号:qspyq2015)

新一代的AlphaGo Zero,被翻译为阿尔法元,不依赖于任何人类的棋谱,不参考人类任何先验知识,完全靠自己强化学习(reinforcement learning)和参悟,它花三天时间就可以自己左右互博490万棋局。阿法元棋艺增长远超阿尔法狗,以100:0,百战百胜。此前,阿尔法狗曾花了几个月时间,学习人类三千万棋局,才打败人类。更多AlphaGo解读:www.yangfenzi.com/tag/alphago

阿尔法元不再被人类认知所局限,能够发现新知识,开发新策略,它让深度学习用于复杂决策更加方便可行。美国杜克大学人工智能专家陈怡然说:我觉得最有趣的是证明了人类经验由于样本空间大小的限制,往往都收敛于局部而不自知(或无法发现),机器学习可以突破这个限制。

无怪乎纽约客最近的封面文章《人类未来只能给机器人打下手》,并配了一幅人类向机器人乞讨的场景的图片。

这篇文章,就着重说一下,人类要向人工智能学习的三堂课。

深度学习

事实上,带动这波人工智能背后的关键技术——深度学习(deep learning),早在2012年就开始在各种国际舞台上发光发热。在全球最知名的ImageNet机器视觉舞台上,由深度学习之父Hinton领军的团队,首次参赛就让原本停滞难以再进步的正确率大幅提升。(2010为72%,2011年为74%,2012年为85%)。不仅如此,这个数字进步的速度令人咋舌,在短短三年的时间内,微软研究院用了高达152层的神经网络让正确率提升到95.06%,这个数字背后的意义在于,机器终于跨过了人类视觉的94.9%的壁垒。

从此之后,深度学习就一再创造奇迹,2017年在语音转文字上,以95.51%的正确率赢过了人力速记员的单词正确率94.9%(这数字的确跟视觉的壁垒是一样的,人类为何常常卡在95%这关,值得研究)。DeepMind团队则是在唇语领域上以超高的93.4%赢过了人类79.6%的水平。来自卡耐基梅隆大学操刀的Libratus,也在一对一不限注的德州扑克国际竞赛中,击败所有的人类参赛者。

在看到这一波波的机器的胜绩之后,大家首先会担忧工作是否会不保,但是让我们今天先把这件事放一边,我们从算法原理(放心,后方无致人昏睡的数学)的角度来看看,到底是什么关键点造就了这些成果。身为深度学习的从业人员的我,有时觉得这些神经网络不仅是单单模仿人类,在某些地方甚至是人类没有做到位的部分,却能在深度学习身上看到。

第一堂课:分享、共享

深度学习是从机器视觉领域开始展露头角的,可是要知道,神经网络(neural network)这项技术至今已经将近80年了。我依然记忆犹新的是我之前在教授机器学习的课程中,常常告诉学生神经网络的权重又多又复杂、缺乏好的方式进行优化,所以耗费时间极长,没事不建议使用……之类云云。但是为何现在更深更复杂的网络却能够处理,除了现在是一个前所未有充满计算力的时代,大家手上任何一台智能手机的计算力其实都超过当初阿波罗号登月美国太空总署后台的超级计算机,这些计算力当然也是助力之一。但是其实真正关键则是来自于“共享权重”的概念,分享正是人工智能要教人类的第一堂课。

拿人类的视觉来说,当一只猫不管出现在我们视野的哪个位置,他始终就是一只猫,不会变成任何其他的动物。这个现象意味着我们人类视网膜的1.2亿个视杆细胞,其实都是用同一套规则在解读世界的。所以现代的深度学习有别于以往神经网络每个神经元各自学习的做法,而改为同深度神经元共享权重(在此各位可以把权重视为学习到的特征)。如此一来不但节省了数亿倍的运算量,而且每个神经元都能学习到比过去各自学习时更完整的特征。

回头看看人类,共享难道不是推动人类进步的一大助力吗?现在人工智能风潮能够比过往来的更强烈,其实跟现在所有主流分析框架都是开源有着密不可分的关系,对,全部都是开源且免费….。2008年,全球最大的面向开源软件项目的托管平台Github问世(我们常戏称这是全球最大的同性交友平台),带动了程序代码分享的风气,而这些分享其实也是人类文明在近期能够以前所未有的速度进步的主因。对许多人来说分享往往会变成滥好人的同义词,我们先跳开那些共享单车、共享充电宝这些前景还不明确的商业模式,若是仔细解读这两年硅谷拿到高额投资的初创企业,有一半以上都有将技术开源。把视为公司核心竞争力的技术开源是否意味着公司贬值?但是事实上透过开源冷启动所获得的用户基数,以及透过开源来提升代码与产品的质量,这些新创公司从开源上得到的好处其实是远超过敝帚自珍的。

第二堂课:专注

除了共享权重之外,另一个概念“感知域”也是深刻地影响机器视觉的效果。在以前的神经网络中,我们总是企图要让每个神经元学习与全体所有神经元之间的关联,这个想法造成计算量膨胀到人类无法解决,但是想想我们人在看东西时,总是把目光聚焦在一处,其他周遭的画面就变得模糊,这个概念被用在了深度学习带来了感知域的观念,也就是说只需要专注在周遭的神经元就可以,其他较远的都可以不用管他,专注,正是人工智能要教人类的第二堂课。

再来我们把角度从视觉换成听觉,语音识别是大家最普遍使用的人工智能应用之一,从早期的语音转文本,到现在更进一步的去理解句子中的语意,用的是我们称之为递归神经网络(RNN)的技术。它一样有着共享权重的特性,而且它具备了本次的输出就是下一次的输入这样的递归结构,很适合用来处理本质就是序列的语音与语言。像是神经网络翻译技术就是广为人知的,但是毕竟语言的本质比图像抽象很多,所以早期深度学习处理语意这块并不能得到很好的成果,这个问题一直到了一个新的技术观念问世为止,那就是“注意力(attention)”。这个技术概念其实非常直接,当我们在翻译一段英文时,通常是看完整句后,然后除了要翻译的字词之外,还会推敲一下上下文,有些字是特别重要的,会造成语意的极大差异,而有些字则是有或没有都不至于造成严重的影响。评估这些特定范围的字的影响力的机制就被称为“注意力”。更多人工智能AI解读:www.yangfenzi.com/tag/rengongzhineng

人类世界也是这样,就像是有些新创公司急着每种商业模式都想碰一碰钻一钻,但是往往只会落到徒劳无功的下场。唯有专注,不仅要在特定领域中做到最好,而且要具备强大的“注意力”机制,才能够从千丝万缕的信息中,找出真正值得全心投入的领域。

第三堂课:全局观

人工智能要教人类的第三堂课是“全局观”。还记得柯杰在人机大战后谈到AlphaGo说到,“感觉AlphaGo和去年判若两人,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝……”。为何会让人感到不像人而像神,而这中间的差别是什么,我认为巴菲特的名言在此分外贴切——“人们总是在该恐惧的时候贪婪,在该贪婪的时候恐惧”,我想这就是人性的一个很好的批注。说人工智能像神其实有点言过其实,但是若是说到让人感受到神性的部分,恐怕在于人类总是会被当下的情势、被自己心中的贪嗔痴所束缚而做出错误的决定,而机器却能够完全不被影响,只往最后目标前进。

在每个深度学习神经网络中,我们都会给予它一个损失函数,神经网络的任务就是要想办法透过学习来让损失降低。那如果两个任务不同且损失不同的神经网络铐在一起时(我们称之为联合学习),会发生甚么事。如果是人类的世界,恐怕两个人都会着眼于自己的损失最小化,而做出错误的决定,最后导致双输。那深度学习呢?下面这张图是我之前在处理这种联合学习的截图,当时看到这个景象其实整个人是深受感动的。神经网络的做法是,它们可以一起接受短期的损失增加,甚至像图中是短期损失高到吓人,但是他们却能携手度过,一起迈向整体损失更低的新境界,在深度学习的眼中,只有全局目标,不会受短期损失影响。仔细想想人类的文明,多少资源都浪费在大家为了巩固自己的短期利益,而造成全体众人皆输的惨境,有时想想也荒谬,在商业世界失去了的人性,反而能在人工智能身上找回来。

我不知道未来的世界会如何,我只知道现在是站在新的工业革命的起点,既然分享、专注、全局观,能将没用的神经网络改头换面,我相信人类也能再次进化,创造新的文明奇迹,更何况这些本来就是我们曾拥有但是丢失的初心……

作者尹相志为:Deepbelief人工智能科学家。华院数据科学家。2002年在中国台湾创立亚洲资采,台湾第一个大数据公司。

·氧分子网http://www.yangfenzi.com)延伸阅读:

➤ 黄铁军:电脑传奇智能之争,人工智能 神经网络 深度学习

➤ 嘉御基金卫哲:为什么90%以上的人工智能都是「伪人工智能」?

➤ 没有任何行业可以忽视人工智能——MIT EmTech Digital 峰会干货

➤ 雷鸣对话吴恩达:超级大咖深度解析人工智能的发展现状与未来

➤ 人工智能历史十大里程碑:神经网络 人机对话 奇点理论 自动驾驶…

➤ 从概念提出到走向繁荣:人工智能AI、机器学习和深度学习的区别

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网http://www.yangfenzi.com)综合整理

您可能还喜欢…

1 Response

  1. 李开复:AlphaGo Zero 证明AI进化速度远比人类想象的更快说道:

    昨天AlphaGo Zero横空出世,碾压围棋界。AlphaGo Zero完全不用人类过去的棋谱和知识,就再次打破人类认知。很多媒体问我对AlphaGo Zero的看法,我的观点是:一是AI前进的速度比想象中更快,即便是行业内的人士都被AlphaGo Zero跌破眼镜;二是要正视中国在人工智能学术方面和英美的差距。

    一方面,AlphaGo Zero的自主学习带来的技术革新并非适用于所有人工智能领域。围棋是一种对弈游戏,是信息透明,有明确结构,而且可用规则穷举的。对弈之外,AlphaGo Zero的技术可能在其他领域应用,比如新材料开发,新药的化学结构探索等,但这也需要时间验证。而且语音识别、图像识别、自然语音理解、无人驾驶等领域,数据是无法穷举,也很难完全无中生有。AlphaGo Zero的技术可以降低数据需求(比如说WayMo的数据模拟),但是依然需要大量的数据。

    另一方面,AlphaGo Zero里面并没有新的巨大的理论突破。它使用的Tabula Rosa learning(白板学习,不用人类知识),是以前的围棋系统Crazy Stone最先使用的。AlphaGo Zero里面最核心使用的技术ResNet,是微软亚洲研究院的孙剑发明的。孙剑现任旷视科技Face++首席科学家。

    虽然如此,这篇论文的影响力也是巨大的。AlphaGo Zero 能够完美集成这些技术,本身就具有里程碑意义。DeepMind的这一成果具有指向标意义,证明这个方向的可行性。在科研工程领域,探索前所未知的方向是困难重重的,一旦有了可行性证明,跟随者的风险就会巨幅下降。我相信从昨天开始,所有做围棋对弈的研究人员都在开始学习或复制AlphaGo Zero。材料、医疗领域的很多研究员也开始探索。

    AlphaGo Zero的工程和算法确实非常厉害。但千万不要对此产生误解,认为人工智能是万能的,所有人工智能都可以无需人类经验从零学习,得出人工智能威胁论。AlphaGo Zero证明了AI 在快速发展,也验证了英美的科研能力,让我们看到在有些领域可以不用人类知识、人类数据、人类引导就做出顶级的突破。但是,AlphaGo Zero只能在单一简单领域应用,更不具有自主思考、设定目标、创意、自我意识。即便聪明如AlphaGo Zero,也是在人类给下目标,做好数字优化而已。这项结果并没有推进所谓“奇点”理论。

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>