长久以来,行为心理学家使用迷宫来测试啮齿类动物的学习能力。现在,计算机科学家也使用同样的方法测试人工智能。
行为心理学家曾长时间使用迷宫来研究记忆和学习,但他们之前的试验对象大部分是老鼠。
现在研究者们开始使用同样的方法,来测试一种全新的实验对象——新生的人工智能。他们在“我的世界”这个网络游戏中创建了自己的迷宫,并将这些人工智能置于其中。
迷宫的应用在行为心理学中有很长的历史。在20世纪初期,科学家们开始对老鼠的记忆和学习能力感兴趣。特别是他们开始研究类似强化学习方法这样的学习机制。
迷宫就成为了进行这种研究的标准工具。研究者们会设计一个复杂的迷宫,并在其中心放置某些奖励,之后将一只老鼠放到其中,看它可以多快地破解它。
心理学家很快就发现,就算老鼠带有某些感官障碍——瞎、聋或是被拔掉胡须,它们仍然可以很快的学习并找到它们的路。
但是早期复杂的迷宫意味着实验难以进行比较。因此,现今的心理学家选择使用Ts或Ys形状这样简单的迷宫,这样它们就可以轻易地在任何试验室中被重建。
借此人们可以得知老鼠是如何学习的,以及基因决定了老鼠能多快解开迷宫,等等。近几年,计算机科学家甚至开发了虚拟现实的迷宫,老鼠将被迫盯着一个显示器并被固定在某种追踪球上,在其上它可以走或跑。通过这种方法,老鼠可以通过虚拟的迷宫。
现在Junhyuk Oh和他在密歇根大学的同事们开始使用一种全新的迷宫来测试一种全新存在的认知能力。这个全新的迷宫被建在“我的世界”这个游戏中。在这个3D的世界中,玩家可以用砖头搭建几乎所有的东西,建个迷宫再简单不过了。
但Oh和他的同时们测试的对象却更加奇特——它们是人工智能。虽然这些机器在理想环境中可以轻松地进行学习,但在真实世界的情况下还是会遇到困难——在真实世界中物体可能是部分模糊的,图像与位移需要非常小心才能成功匹配,而且产生的效果会有延时。
这个研究要结决一个重要的问题,什么样的人工智能系统擅长解迷宫。但对于人工智能系统如何应对这些问题的研究是十分困难的,因为复杂的环境难以重建。而这正是“我的世界”起作用的地方。
Oh的团队创建了一组迷宫,并让他们的人工智能算法在其中处理更加复杂的任务。比如说,一个任务可能是在迷宫中找到红色方块;如果看到的第一个方块是黄色,那么下一个任务是找到红色方块,其他情况则寻找蓝色方块等等(请看下面视频)。
这些迷宫确保不会存在一条清晰的线路通往方块所在地,算法需要匹配它的位移和图像来进行探索。团队还会对于完成任务给予不同的奖励。最重要的是,相同的并且拥有同样难度的任务可以反复的进行。
他们的成果就是对该类型的人工智能认知能力的首次系统性探索。该团队表示,表现最好的系统使用了通过额外内存强化的深度强化学习方法。这些机器基于已储存的环境信息来检索相关的记忆,借此它可以为自己定位。它与其它现存的存储系统区别是,其它系统并不依靠环境进行记忆检索。
“我们的实验结果表明,依靠环境的记忆检索可以更有效率地完成我们的任务,”他们说。
这个有趣的工作将为未来AI开发指明道路。“我的世界”中的迷宫可以简单的重建,这允许任何人将其人工智能系统在这里测试,并将结果与其他系统的表现进行比较。
其成果也使扩展该研究成为可能。“在未来的工作中,我们打算加强‘我的世界’区域的灵活性,建立更加富有挑战性的认知任务,以便进一步地评测我们的AI系统,”Oh和他的同事们说道。
这也提出了一个吸引人的前景。也许以后,我们第一次看到人工智能完成更先进任务的地方,将会是在“我的世界”这样的虚拟现实设定中。这也为探索一些关于伦理问题的人工智能研究提供了一个良性的环境。
所以当你或是你的孩子沉浸在“我的世界”中时,仔细看看其他的玩家,也许你们正在和一群人工智能们玩耍着。
【翻译:Saphir DeepTech深科技(微信号:mit-tr)】
·氧分子网(http://www.yangfenzi.com)延伸阅读:
➤ 孙雯玉:关于语音搜索,我和很多人打了个7天的赌
➤ 扎克伯格打脸马斯克:人工智能威胁论就是发神经!
➤ 美国天普大学王培:图灵测试是人工智能的标准吗?
➤ 专访地平线机器人创始团队:余凯的地平线机器人是家什么样公司
➤ 卡耐基梅隆大学邢波:为人工智能装上引擎—忆格拉丹东登山之旅
➤ 白宫筹建人工智能委员会,欲用 AI 实现美国梦
➤ Star VC投资商汤科技SenseTime,“明星+星探”双重落地人工智能
➤ 百度推广内测“URL定向”产品,网友评论褒贬不一(附官方产品手册)
➤ 六大院长:人工智能技术与趋势报告(干货大放送)
➤ 后 ImageNet 时代:李飞飞视觉基因组重磅计划,新一轮竞赛!
➤ Gartner 院士级分析师,解读 2016 年十大战略科技趋势
➤ Facebook首次公开内部机器学习平台,启动AI帝国