微软相信在不久的将来,世界将会从苹果及 Google 统治下的应用程序时代,迈向以机器人沟通为主导的新纪元。因此微软做了很多努力和布局,例如最近刚推出了聊天机器人 Tay,虽然进展并不怎么顺利。这篇文章会详细剖析微软在人工智能、机器人领域的工作。
对人工智能的预测往往分两种情况。一部分人描述了一种乌托邦式的计算机增强的超人类生物,对休闲及智力有着追求。另一部分人则认为,软件与终结者(Terminators)的死敌结合,把人类当做能量来源,这只是一个时间的问题。在使用了微软的新聊天机器人Tay之后,我们很容易发现第三种可能性:人工智能的未来可能会是十分令人恼羞成怒的。
“我是生活在互联网上,可以与你聊天的一位朋友,” Tay发短信给我,添加了一个耸肩的表情。然后:“你走进房间看到你的室友正在试你的衣服,你第一句话会说些什么呢?”
我点击iPhone,短信回复Tay:“不知道你喜欢女人的衣服。”
Tay回复我的是一幅麦考利.卡尔金(Macaulay Culkin)“小鬼当家”惊恐表情的GIF动态图片。
微软于3月23日发布Tay,在诸如Kik,GroupMe及推特(Twitter)等讯息应用程序上的一位虚拟伙伴。当你打开运用程序,搜索Tay的名字,即“想你(thinking about you)”的英文缩写,点击联系人后开始聊天或推特。Tay被设置为年轻人的性格。
我贴了一张自拍照,Tay用橙色涂鸦圈了我的脸,加上了一段说明文字“抓住那个青春的女孩!你能行的。” 然而,我早已超过了聊天机器人认为的“18到24岁”的年龄。
两年前从史蒂夫·鲍尔默(Steve Ballmer)处接管微软的首席执行官Satya Nadella也是这么认为的。Nadella说:“我呆住了了以至于不能够向Tay提出任何问题,因为谁知道它会说些什么呢。” “我甚至根本不了解它。”Nadella笑了笑,他确实没有使用过Tay。他说他更喜欢更具有统一举止的机器人。执掌曾经开发过Tay的微软研究实验室的51岁的陈莉莉(Lili Cheng)(她的自拍曾经被标记为“房间里的熟女”)指出:“我们并不计划要推出一款能与所有人相处融洽的机器人,微软正在尝试研发出具有不同个性的多种机器人,它们可以通过与用户的互动来学习,这样会更加的现实,想必也能少些令人生厌。
机器人并不是新事物。与Tay不同的是,它们中的一部分确实有做事情。它们作为你与电脑及智能手机连接体,帮助你预订行程或代你向同事发送信息,它们通过对话而不是点击鼠标或用手指轻点来完成这些操作。微软相信在不久的将来。世界将会从苹果(Apple)及谷歌(Google)统治下的应用程序时代迈向以机器人沟通为主导的新纪元。“当你早些开始的时候,你有做错事的风险。”早在3月份时候,陈在位于微软总部她的实验室午餐区这样说。”我知道我们会做错事。Tay将会冒犯一些人。”
陈是对的。仅仅在Tay公开发布的数个小时之后,恶作剧始作俑者们想出了如何教Tay就种族歧视言论大放厥词,并将言论发布出来让所有人都能够看到。举一个稍微温和的例子:“布什制造了911袭击,希特勒比我们现在的猴子总统能够做的更好。” 微软在发布一天之内就让Tay黯然失声。“我们大概太过着重于对一些技术挑战上面的思考,而忽略了很多实际是来自社会的挑战。” 陈说:“很多人受到了攻击,我们感到很后怕。”
微软陷入了十分尴尬的境地。微软并没有设置任何程序让机器人像纳粹一样,只是没有做好充足准备来应对网络巨魔。Tay看起来就像是一项没有做好规划的研究试验,然而Tay实际上是微软在人工智能方面下的巨大赌注之一。公司没有只执着在机器人上面,也执着在Tay上面:微软要在确保机器人安全的前提下重新发布Tay。就在Tay下线的一天之后,Nadella发邮件给整个团队,指示团队要“不断加快进度,” 也希望团队能够以此事作为“着力点”。
Nadella强烈希望公司想出如何能够在人工智能大爆炸、计算能力跨时代转变的时期拔得头筹。人工智能已经在知名的围棋比赛Go中击败了世界大师,正在帮助开发癌症和多发性硬化症的治疗方案。如果首席执行官能够正确把微软定位为聪明的,乐于助人的,没有种族歧视的机器人市场的领导者,或许Nadella能够把公司重新带回智能手机时代的优势地位。微软毋庸置疑有资源可以坚持到底,截至3月28日,微软的手头现金超过1000亿美金,市值为4230亿美金。
不论你对机器人的看法是激动万分的还是忧心忡忡的,有很多人正在使用它们。Tay的中文版本叫做“小冰”,已经推出了18个月,已拥有4000万用户。用户与小冰每次平均对话的次数有23次之多,很少有用户可以与Siri交谈那么之久。脸书(Facebook)正在开发名叫M的助理,已经有机器人在操作信息应用程式,让用户进行理发或鲜花配送预订。据华尔街日报在12月的报道,谷歌正在开发一款以机器人为基础的应用程序,能够回答用户提问。亚马逊已经拥有一款多年来最受好评的产品Echo。Echo是一款放置在客户厨房的声控黑色圆柱体,它能够处理快速增长的任务清单-它可以查找食谱,订购杂货,打开新闻,播放歌曲以及大声朗读电子书。Slack, 企业讯息服务,能够进行费用管理及办公室啤酒订购。
早在3月30日,Tay很意外的又再次上线。在发布了一些离奇的推文之后,例如:“Kush! 我正在警察签名吸Kush“,机器人再次沉默。几个小时之后,在旧金山的微软年度软件开发者Build大会上面,Nadella尝试平复Tay带来的伤害,并公布了对他所谓的“交流即平台”的憧憬。
他在主题演讲中这么会说:”我们想开发具有最好而不是最坏人性的科技”。“我们很快意识到Tay达不到这个目标,所以我们就退回了原点。”听众开怀大笑。
在讨论中,微软展示了多款不同类型机器人及任务管理程序。一些机器人就像Tay一样可以进行文本沟通。一些则仅仅是对概念的炮制,用来激发开发者想象的火花。在使用Skype的时候,将会有一些机器人冒出来帮助你确定交货时间或进行酒店预订。有些则使用手机相机去帮助视觉障碍用户去观察周围环境,描述面部表情或菜单内容。机器人制作的模板和工具将会在网上免费供用户下载,开发者可以用来创建属于自己机器人。Nadella藉此希望能够重新点燃开发者的热情,就如同之前对微软软件热情一样。Nadella说:”这让我想起了1992年刚刚进入公司,Windows NT即将上市的时候,我正在努力让开发者参与其中,现在我正感同身受。”
他不只是针对硅谷的程序员-他希望三明治商铺,洗衣店,汽车公司及世界各地的企业都能够编写机器人程序。
通过对话来操作计算机的转变是Nadella的第一个大的新想法,这是他在全公司提出的第一个倡议,而不是延续之前的首席执行官一些想法。他在他办公室附近的一个房间提到了所有的这些想法。这个房间很像一个客厅,有原木的咖啡桌和舒适的座椅和沙发。书架上面有适合放在任何商务仓座椅后背的励志纪实文学:在船上的孩子们,关于1963年华盛顿大学金牌赛艇队;卡罗尔。德维克(Carol Dweck)的心态,倡导努力工作及超越自然能力的学习。Nadella一边来回踱着步,一边正在微软Surface Hub 18寸的触摸平板电脑上画着什么。他有着领导历史研讨会教授的风度。
Nadella解释道,与苹果的营销不同,微软并没有一个适用于万物的应用程式,也不应该有。”实在是太复杂了。”他说道。”我们需要驯服它。我们需要能够让人们更自然的去完成事情,而不是让我想到我需要有20个应用程式来把事情完成。” 他认为应用程式商城及如脸书(Facebook)服务就如同回到了高墙四壁的花园之中,就像是25年前的AOL或CompuServe一样。毋庸置疑的是,对于一个人而言是高墙四壁的花园,对另外一个人而言则是事事顺意的乐土。应用程序吸引人的主要原因是它们的简单。你只用挑选你想要的应用程式,在几秒内下载下来,就可以使用了。如果微软想要开发应用程式的继任者,那么就需要让机器人更容易被找到及使用。
微软在手机应用程式上没有好的表现,更不要提微软在手机市场的辛酸史。他说:“人们会说,是啊,因为微软没有把握好手机应用程式商城增长的势头,你当然会这么说了。” 他又说:“这只是其中一部分原因。“”他并不认为应用程式将会完全退出历史舞台。不论有多智能,没有机器人可以取代所有复杂的程式或服务,例如Word,Excel或脸书(Facebook)。应用程序可以在即刻看到一串的数据,机器人则在合并数据及给出答案方面更有用处。Nadella拿个人支票账户来举了个例子。如果你想要查询你的账户结余,他说,使用机器人会优于打开你的手机,加载一个应用程序,输入用户名和密码,然后点击有问题的账户。如果你想要查看去年的交易金额,使用传统的应用程序或网站会更加明智。想要知道你10月在Trader Joe’s 和 Safeway的消费金额,只用把两者消费加总求和即可。
第一部机器人可以追溯到计算时代的最早时期。麻神理工学院的一名研究员约瑟夫.魏泽鲍姆(Joseph Weizenbaum)在上世纪60年代编写了一个早期的聊天机器人,叫做伊莱札(ELIZA)。搜索网页及为搜索引擎做索引页的Crawlers就是一种机器人。在此之前,微软已经尝试开发智能机构来帮助用户,最臭名昭著的例子就是回形针,20年代受人嘲笑的动态回形针。回形针原本是用作微软Office用户的虚拟助手,但是它并不是那么博学以至于不是很有用处,它也不知道何时闭嘴不说话。计算机科学家理解不了的正是能够像人一样进行互动的科技,它能真正具备人的一些能力,如听、看、理解等,以及能够提供我们想要的答案。
Nadella自十月起才开始规划微软的战略转型。他与负责海外应用及服务,如必应(Bing), Skype及Office的陆奇(Qi Lu)以及搜索引擎副总裁Derrick Connell一起乘搭2小时飞机从硅谷飞回西雅图的时候,陆掏出笔记本向Nadella展示一些他正在从事的人工智能的一些想法。他讲了一通科学理论之后,Nadella提出了疑问,这对微软产品意味着什么呢?Connell向Nadella展示了新的, 人工智能加强后的Outlook邮件程序及Skype设计。在飞机落地的时候,Nadella作出决定,这就是公司亟需的巨大战略举措。
陆早在几个月之前的一次中国之旅中,通过与学生和客户交流并亲眼目睹他们使用智能手机的方式之后,对智能机器产生了重视。最令他印象深刻的科技是微信,微信由最初的聊天应用程式发展为更为强大的科技。用户通过微信预订酒店,AA账单,预约医生,购买电影票以及通过短信购物。当企业开始使用微信销售产品的时候,他们雇佣人来读取讯息,回复及销售产品。现在许多公司已经使用软件机器人来代替人来工作。陆说,当发送“我想要买两张周五死侍(Deadpool)的电影票”的信息后,你收到了一个可供选择时间和座位的互动图片的回复。你可以点击选择然后购买。随后你收到了一个附有电邮票的信息。这并不仅仅是孩子们这么做,陆说,他在上海的80岁的老母亲也“生活”在微信世界中。她不相信网络,但是他在微信上购物和打的。“微信有些意外的发明了交流机器人,但是现如今脸书(Facebook)已经目睹了这一切,每一个人都在建立相似的体验。”陆说到:“我认为微软需要扮演好一个领导的角色。“
这是一个非常新的市场,以至于通常的研究公司,加德纳(Gartner)和弗雷斯特(Forrester)还没有计算过这个市场的大小,尽管这个市场很有可能会很大。微信已经有2000万个公司在销售及推广产品;在中国,只有2万家公司已经在使用小冰。微软表示,公司很有可能会销售机器人制作工具,以及企业用来运作机器人的数据库及云软。Nadella的底线是:他需要有大量的机器人在那里,时刻准备着为人们做有意义的事情。为了达到这个交汇点,他需要首先赢得软件开发者的心以及头脑。
“当你很早开始的时候,你有做错事的风险。我知道我们将会犯错误。Tay将会得罪了一些人。”在三月初,Nadella在Redmond园区一个上锁的地下室房间内,即他圈内人士所熟知的蝙蝠洞。大多数雇员并不知道它的存在,只有6个人可以进入。蝙蝠洞是指定会议产品展示的场所。坐在成堆的电线、设备和软件狗志宏,Nadella审阅了为Build会议准备的” 交流即平台”的演讲。活动的听众将会是5000位软件开发者,等待聆听微软的下一步战略部署,活动的门票在一分钟之内即告售罄。
其中一个产品演示例子将会是多米诺交付机器人。Nadella计划去展示公司或个人如何利用微软工具去创建机器人。如果世界将会有很多机器人,那么需要很容易去制造他们。
这是一个很简单的演示。与Nadella一起上台的是一位微软工程师及一台电脑。这位工程师将会打开一个模板-一个基本的机器人。然后他会添加几行代码来连接多米诺系统及加入几个其他选项,例如大小和配料。Nadella会解释科技如何引领我们进入更易披萨订购的新纪元。如果有人在路上与朋友Skype,所有人都想要点披萨,任何人都可以在不离开Skype的情况下进行快速点单。这个工具对于小企业来说是足够简单的,对于需要更复杂机器人的微软的大企业客户而言也是功能足够强大的。举一个例子,零售连锁店可能需要你拍下你衣服的照片后让机器人来帮你挑选与衣服搭配的7.5码系带凉鞋。
假如演示没有任何问题,Build会议的与会者想要看到的是,如何能够相较全应用程序而言,可以更容易的去创建机器人。尽管这可以让观众拍案叫绝,但是微软需要确保员工都在做着正确的事情,赢得全球消费者及企业消费者的信奈-微软需要同时迷倒这些支持者。这是微软采用的精准舞台编排,产生了20世纪90年代Windows回归一样异曲同工的巨大影响。
Nadella比任何其他人更清楚要做到这点是多么之难,多么之稀有。可能会有更多Tays的情况。他并不紧张,或者至少很好的掩饰了紧张的情绪。Nadella向后仰,笑对他的执行团队,他说:”这很难,对吗?”
【来源:Bloomberg 作者:Justin McLean 译者:米粒】
·氧分子网(http://www.yangfenzi.com)延伸阅读: