微软和谷歌都相信,未来将是人工智能的世界。这两家公司有不同的传统,也有差异化的竞争优势。而新一轮的人工智能产业竞赛,有一个显著的特点是各公司不再在同一个切入口角逐,而是基于自身在此前的发展中积累的优势,选择一个入口进军人工智能行业。那么微软和谷歌,它们到底打算怎么做?
未来,机器人就是应用程序,人工智能将会进入我们的生活,微软现任CEO萨蒂亚·纳德拉在今年的微软Build世界开发者大会上说。
这不由得让人想到微软对家用电脑的颠覆。微软在20世纪80年代凭借MS-DOS在家用电脑操作系统上崭露头角,成功重塑了当时电脑业的规则和生态系统,让PC进入更多的家庭,后来更是依靠Windows成为家用电脑操作系统的统治者。微软在1986年3月首次上市募股,股票的迅速蹿升让微软的市值达到了5亿200万,微软创始人盖茨在后来成为了世界首富。
2010年,苹果凭借在智能手机上的出色表现,市值达到了2270多亿美元,夺走了微软在科技公司市值排行榜上的头把交椅。2013年,另一家科技公司谷歌的市值也超过微软,把微软挤到了第三名,尽管在随后的几年中,两家公司排名互有更替,但是微软一家独大的日子确实已经一去不复返了。
2016年2月,Google 母公司Alphabet 通过公司分拆以及搜索广告业务的持续强势,股价继续攀升。美国时间周一,Alphabet 的公司市值已超过了苹果,达到了5700 亿美元左右,成为世界市值最高的公司。成功赶超苹果和微软的谷歌创立于1998年,最初做的是搜索引擎,到2011年5月,谷歌网站的月独立访客数量首次超过十亿。成为世界上首个达到这一记录的网站。事实上,谷歌和微软在搜索引擎、浏览器、手机系统、工作软件等等方面都是直接的竞争对手。
谷歌凭借搜索引擎发力,后来居上,实现对微软的超越,很大程度上可以看成是数据的胜利。在互联网飞速发展的带动下,人类社会早已从信息缺乏走到了信息过剩的时代。数据即信息,未来,对数据的处理能力将在很大程度上决定一个公司的后发力量。在新的时代,搜索必须要由模糊搜索向精准搜索过渡,对计算能力和深度学习的需要将进一步推动人类迈进人工智能化时代。
数据是深度学习和超级计算的“物质基础”,拥有数据等于拥有预测未来的能力。面对一个可能会发展成“赢者通吃”的人工智能市场,几乎所有的科技行业巨头都纷纷开始布局,国外的谷歌、微软、Facebook、亚马逊和IBM等公司,以及国内的百度、阿里、腾讯都有不小的动作,这还不包括大大小小的初创企业。
根据市场调查公司IDC的评估,到2020年,机器学习应用市场将达400亿美元,其中60%的应用将会在亚马逊、谷歌、IBM和微软的平台上运行。《算法大师》(TheMaster Algorithm)一书的作者佩特罗·多明戈(Pedro Domingo)曾说:“谁赢得这场竞赛,谁就成为信息时代下一个阶段的主导者”。在人工智能领域,一场没有硝烟的战争已经悄然开启。
从诞生开始,谷歌就与微软在各个方面展开了竞争,可以说是一对宿命的对手。2010年到2015年,微软和谷歌甚至在智能手机和电子游戏系统专利上的纠纷打了一场长达5年的官司。此次,面对一触即发的人工智能市场争夺战,两家巨头的竞赛究竟发展到了哪一步?
谷歌DeepMind VS 微软牛津计划
2011年,谷歌推出了第一代内部深度学习结构DistBelief,利用谷歌自身的数据中心构建大型的神经网络,可用于语音识别和图片搜索等人工智能技术的开发,2012年 GoogleX Lab让一千台电脑架成的Google Brain观看了一千张从Youtube上随机截图的静止画面,在没有在系统中预设任何图像知识、也没有在突破上附加任何说明标签的情况下,Google通过三天的学习,可以自动将这些突破区分成三类:人脸、身体和猫。能够区分出猫的照片,即能够在庞杂的资料中找到抽象的规则。意味着机器深度学习取得突破。
2014年,谷歌收购了擅长算法的英国公司DeepMind,作为公司旗下专门负责人工智能的分公司, Deepmind推出的AlphaGo在今年春天战胜人类围棋大师李世石,一鸣惊人。
2015年,谷歌年发布人工智能系统TensorFlow,并选择将之开源。TensorFlow是一个深度学习引擎,支持目前在图像、语音和神经语言程序上最流行的深度神经模型网络CNN、RNN和LSTM 的算法,可在Gmail、Photos、Translate、YouTube等产品中应用。
Google在2007年曾推出开源操作系统Android,让开发者可以自行定制开发。目前市场上半数以上的智能手机就是这个开源的Android系统。谷歌的TensorFlow有机会成为人工智能领域的Android吗?
和谷歌的DeepMind相对,微软在人工智能领域的代表是牛津计划。牛津计划发布与2015年5月初,由一系列基于云端的机器学习相关的API,SDK和相关服务等组成,旨在让开发人员们不需要繁复的机器学习背景也能开发跨平台的更智能和更交互的应用。当时,牛津计划率先开放了人脸识别、语音处理和计算机视觉三个部分。
10月末,语言理解智能服务(LUIS)对外开放,并提供了中文支持,同时将之前开放的脸部识别、计算机视觉和语音识别SDK加入GitHub。11月,拼写检查和人脸识别的更新内容对外发布,并预告了一系列将在年底发布的新功能。现在,说话者识别API(SpeakerAPIs)和视频API(Video APIs)的公开测试版已经推出,自定义智能语音识别服务(CRIS)也已经开放邀请。
2016年1月25日,微软在GitHub上发布了其深度学习工具包——ComputationalNetwork Toolkit(简称CNTK)。3月底举行的2016Build大会上,微软继续了机器人平台Bot Framwork,开发者可以在平台上定制各种服务型机器人。
微软现行的策略是希望把牛津计划中的相关服务向开发者开放,让他们可以在微软既有的产品服务中加入这些人工智能化的技术,比如,在Skype中加入机智能机器人小娜,让你在使用Skype通话时,让小娜帮你处理信息搜索、发送和回复等事情。
牛津计划的是非常商业化的,其终极目标更关注于利用人工智能来推动智能手机和电脑操作系统的销售,它所需要处理的数据并不像谷歌那么大。
DeepMind和牛津计划可以看成是谷歌和微软在人工智能领域投入的核心部分。提供开源API将能促进这两家公司在人工智能行业的布局,帮助公司在人工智能发展日益重要的未来抢占更多的主导权,所以不管是DeepMind还是牛津计划在未来都会是两家公司的战略重点。
谷歌和微软的人工智能产品对比
谷歌 | 微软 |
Google Now | 小冰,Cortana |
Google App Engine | Microsoft Azure |
Google Glass | Torque |
无人车 | 聊天机器人 |
Google Now vs Cortana
微软的Cortana(小娜)和GoogleNow都是协助型人工智能产品。去年5月,谷歌宣布对GoogleNow进行了一次重要的升级,Google Now已经可以了解超过一亿个地点。它不仅罗列简单的信息,还为用户提供一系列建议,包括何时去附近的餐厅吃饭更合适此类的功能。
在Build2016大会上,微软宣布,小娜的智能程度将得到进一步的提升,例如当你向Cortana下达命令说:把我昨晚做的PPT发给谁,它就会准确无误地完成。当你收到新短信通知时,提取消息中包含的时间信息后,Cortana就会询问你是否创建一个日历提醒。
Google App Engine vs Microsoft Azure
Google App Engine基于云计算服务,是谷歌开发、托管网络应用程序的平台,使用Google管理的数据中心。第一个Beta版本发布于2008年。2015年,Google宣布,它正在考虑将云业务独立出来,成为一个由VMWare的联合创始人兼CEO Diane Greene领导的组织。
Azure是微软云基础的平台,提供与用运行在微软云数据中心上的数据存储、云计算、网络和多种云应用等服务的集成。用户可以在Azure上构建多种与自己BI工具集成的云应用,还可以利用开放架构,开发自己的与内部服务器、计算机和其他BI工具相连的BI应用。
Google Glass VS Torque
谷歌眼镜曾是谷歌风靡一时的可穿戴式智能产品,穿戴者通过自然语言语音指令与互联网服务联系沟通。Google于2014年4月15日于美国限时贩售Google眼镜,售价为1500美元[11]。2014年5月13日,Google宣布在美国市场公开发售Google眼镜。只要仍有库存,任何人均可以1500美元的价格购买这款产品2015年1月15日,Google宣布将停止生产当前形式的Google眼镜,但仍致力于产品的开发。
2015年2月,微软发布了专为中国用户打造的一款人工智能产品Torque,这款人工智能产品是基于安卓平台所开发的,是微软首个中文可穿戴设备产品,采用微软语音技术和Bing大数据引擎。用户仅凭手势和语音就可控制Torque完成各项动作,例如搜索、通话、发短信、记笔记、设闹钟等。Torque为用户提供安卓手机、智能手表的交互体验。也就是说,Torque可以实现类似于GoogleGlass 的语音操作和可穿戴设备的手势操作了。
2016年初,有消息称,Google搜索业务负责人 Amit Singhal 即将退休,公司机器学习业务高管John Giannandrea 将接任其职。随着Giannandrea接管谷歌搜索引擎部门,很多人把这个举动看作是机器学习引领搜索引擎未来的信号。就解决Google 搜索引擎发展过程中所遇到的问题而言, Google 的这一举动既是领导权的转移,同时也是领导者所属部门的转移。微软方面,2014年9月微软从1000名研发人员中抽调约500人组成了新团队MSR NExT。新团队不是纯粹的研究机构,它关注的是那些会对微软造成重大影响的项目。与此同时,微软研究院另一半员工将致力于为公司产品寻找新的思路。这被看成是微软在加快创新速度上的努力,公司希望更快地把研究院中的设计变成创新产品。
不同入口切入,进一步布局人工智能产业
对于谷歌和微软来说,一个关键的战略是与小型企业合作或是收购一些具有创新能力的初创企业,在人工智能领域,我们看到了许多这样的合作:谷歌2014年收购的人工智能公司DeepMind显示出了他们在人工智能领域的决心;2016年2月,微软以2.5 亿美元的价格收购人工智能输入法应用 SwiftKey,也在进一步加快步伐。
谷歌无人车
新一轮的人工智能产业竞赛中,有一个显著的特点是各公司不再在同一个切入口角逐,而是基于自身在此前的发展中积累的优势选择一个入口进军人工智能行业。
2016年3月中旬,谷歌宣布定出售两年前收购的军用机器人开发公司波士顿动力,似乎要把更多的精力发在其它产品的研发上,有很大的可能,谷歌的精力会重点放在无人车的发展上。
根据Google无人车项目的总监克里斯·阿莫森(ChrisUrmson)在西南偏南大会上的描述,无人车在道路上累计行驶了超过200万英里。谷歌的目标是2020年实现无人驾驶汽车量产。
2016年2月美国NHTSA(美国交通部)给予Google的回执信中表示认可无人驾驶汽车作为“驾驶员“的地位。近期,该决议正式颁布自官网上,认定谷歌无人驾驶符合联邦法律,驾驶责任主体即司机为自动驾驶系统。对人工智能作为“司机”的合法认可,被看成是无人驾驶中一件里程碑似的事件。
是谷歌的无人驾驶车已经成为公司一个标志性的人工智能产品,其基本的思路是利用谷歌在搜索和地图等业务上累积的海量数据来发展无人车,通过无人车铺开车联网,进一步打开人工智能市场。已经可以看到,Google 发布了智能家居系统Brillo、还有一个基于 Android 的操作系统,为嵌入式设备服务。这是一个轻量级的操作系统,可以在你所有的物联网设备中:门锁、灯泡、传感器、以及其他你希望变得聪明的物品得到应用。这个操作系统支持ARM、x86和MIPS硬件,它可以适合128 MB 的存储和 32 MB 的 RAM。
微软聊天机器人
微软的小冰和小娜已经成为该公司目前最有代表性的人工智能产品。具备语言识别、图片识别和自然语言理解能力。在最近的发布会上,微软一直强调将进一步优化智能机器人Cortana,将机器人嵌入它的部分流行服务,比如Skype中去。未来,聊天和助理型的机器人可能是微软在人工智能领域的一个切入口。目前,小冰支持的第三方平台已经包括了微博、京东、微信、米聊、海尔优家等等。
小娜的定位是私人助理,目的是让Windows Phone变的更加易用与人性化,而小冰是活跃在社交平台上,与用户进行沟通。
从发展的重点可以看到,微软在人工智能的着力点是用人工智能来促进既有产品,例如手机操作系统和聊天软件Skype的更加智能化,更面向消费市场。
从蒸汽机到电力再到互联网,长久以来,我们看到了技术在推动人类社会的发展上起到的巨大作用。如今,在人工智能的时代到来之时,科技行业领先的公司们又在不断地尝试,希望掀起另一股技术的浪潮。可以看到,在交通、电信、家居、办公、服务等领域,人工智能技术都已经悄然得到了应用,在未来,我们将会在生活中更多的地方看到人工智能。巨头间的激烈的竞争,最后的赢家可能还是用户,在不断的竞争推动下,用户可能会得以体验更先进、更便利也更便宜的人工智能产品。
【文/胡祥杰 (新智元 微信号:AI_era)】
·氧分子网(http://www.yangfenzi.com)延伸阅读:
谷歌认为这是一个好的尝试,可以作为布局未来车联网及智能汽车的一个切入点。不管是苹果推出的CarPlay、奥迪和Android合作开发的平板还是谷歌的无人驾驶汽车,都是IT巨头觊觎汽车这块大蛋糕,就像下围棋一样,取势,然后占位。硬件上的入侵可能只是开端,更多的是希望占领这项移动终端继而拓展车载服务,这一块确实有无穷的想象空间。也正因为有想象空间,所以只要是个机会,我想巨头都不会放弃。
一个是智能汽车(包括车联网、无人驾驶、车载娱乐系统等);而另一个就是节能减排(这里包括混合动力、电动车等一切实现方式)。我看到的绝大多数只是在玩概念、炒噱头,或者说仅限于提出一个美妙的设想然后得出结论,未来互联网思维一定会颠覆汽车行业。这其中包括无人驾驶、还有特斯拉等等等等。我个人认为,像谷歌无人驾驶、特斯拉还有苹果对于汽车行业的“入侵”(姑且这么说,暂时没想到合适的词语)对于汽车行业而言是好事,毕竟我们知道很多时候能让某个领域产生质变的可能是这个领域之外的东西,互联网的加入也提供了很多新的视角让我们去审视汽车这个业已发展了一百多年的行业。但是,我始终认为,汽车发展不能做到像手机那样井喷式的发展,更多是一个潜移默化的、循序渐进的。
其实我们平常说汽车的技术多么复杂,其实当中绝大部分跟整车厂没关系,尤其是汽车电子。我不认为谷歌和苹果有开发整车的打算和能力。可以这么说,一辆车上的汽车电子技术绝大部分在零部件手里。所以,我认为单纯从实现无人驾驶的技术而言,谷歌就算要竞争,也不是跟整车厂竞争,而是与能提供这种技术和解决方案的零部件企业竞争。毕竟,大家都知道谷歌的无人驾驶是建立在谷歌本身不从事整车研发,而是设计出一个系统来实现的。
。
你现在跑出去随便问个人,问问他汽车无人驾驶,你敢吗?不知道别人怎么说,反正我不敢第一个吃螃蟹。好歹得观察一阵子,看看有没有什么事故啊,会不会失控啊稳不稳定会不会死机啊再说。汽车不是手机,你以为出问题了是刷个机卸个软件或者升级操作系统打个补丁就能解决的吗?所以,其实汽车企业也知道,这不能急,得慢慢让消费者接受无人驾驶的可行性。所以现在其实汽车已经一定程度上实现了无人驾驶,行业的话说,是"实现部分场景下的无人驾驶",
无人驾驶的路还很远,谷歌也就是做了个尝试,且远远不止谷歌一家在做尝试。当然,谷歌虽然相比没有传统零部件巨头的在汽车方面的技术积累,但也有不少自身的优势。包括谷歌拥有的海量地图信息就有可能作为无人驾驶的解决方案的突破口,尤其是目前实现方式不甚明朗的情况下,互联网企业确实可以提供不一样的思路。,Google真的不需要全部自主开发汽车,因为你看微软崛起的时候,他需要自己去开发所有的PC硬件么?
自动驾驶绝对不是一辆车的问题,而是整个交通网信息的整合,不光是车与车之间,甚至车与信号灯之间,与建筑物,基站以及卫星,都要构成一张网,才有全面的安全可言。从这一点上来讲,零部件商也需要寻求it公司的支持,毕竟无论是通信硬件还是大数据挖掘都不是传统零部件供应商的强项。至于特定场景的自动驾驶,博世和大陆早就有了,甚至已经很成熟了。但完全的自动驾驶就好象怎么把零部件组装成一部车一样,还需要各家车厂很多年的努力
就现有的技术来说做到无人驾驶并不难(无非就是雷达、距离传感器、摄像头、安全的算法、稳定的系统。google driveless car第一个通过测试重点就是后面两种条件),难的是 一种标准协议、一种规范的建立。先推一下封闭系统无人驾驶覆盖,在某个试点,开展全封闭的无人车系统,可以视作无人公交系统,类似轨道交通那种封闭,但是成本要低而且组网更方便,先行验证无人驾驶系统的先进性,提高社会认可程度,然后掉过头,促进有人驾驶世界对此的接纳,
在大工业时代,汽车无人驾驶技术可以从其他公司购买,问题不大。谷歌真正的优势在于多年积累下来的地图信息,查了一下,谷歌无人驾驶汽车的负责人正是谷歌街景地图服务的创造者之一。谷歌无人驾驶系统的核心是车顶上的激光测距仪(Velodyne 64-beam)。该设备在高速旋转时向周围发射64束激光,激光碰到周围的物体并返回,便可计算出车体与周边物体的距离。计算机系统再根据这些距离数据描绘出精细的 3D 地形图,然后跟高分辨率地图相结合,生成不同的数据模型供车载计算机系统使用。
1月14日,微软宣布收购加拿大深度学习初创企业 Maluuba,作为协议的一部分,原 Maluuba顾问、深度学习专家 Yoshua Bengio 将出任微软顾问。微软全球执行副总裁,微软人工智能及微软研究事业部负责人沈向洋在微软官方博客上写道:Maluuba 将为微软带来技术与人才,并将在助力微软实现让地球上每一人、每一组织都能使用人工智能并从中受益的愿景中扮演重要角色。
Maluuba 聚焦的研究领域是自然语言处理。今年6月,Maluuba发布了一款基于机器学习的自然语言理解程序EpiReader,能理解并处理未经组织的自然语言在机器理解文本,并在常用的CNN和CBT数据集测试中取得了当时的最佳成绩,超越行业领导者IBM Waston、Facebook和谷歌 DeepMind。
新智元此前曾报道,Maluuba在今年6月宣布,获得A轮融资900万美元。
微软全球执行副总裁,微软人工智能及微软研究事业部负责人沈向洋在“微软中国”的官方博客上写道:
今天是令人激动的一天,微软在人工智能(AI)领域又取得了新的进展。我们就收购人工智能初创公司 Maluuba 事宜达成了共识。Maluuba 是总部位于蒙特利尔市的一家公司,拥有全球最令人瞩目的聚焦自然语言理解的深度学习研究实验室。Maluuba 擅长问答及决策系统的深度学习与强化学习,这将助力微软推进普及且全民化人工智能的战略,让每个人都可以使用人工智能,并从中受益——包括每一个消费者、企业和开发者。
凭借已有的深度学习技术,我们最近在语言及图像识别领域取得了出色的成就——机器阅读与写作。就像著名冰球运动员 Wayne Gretzky 所说,我们正“滑向冰球将出现的地方”。
Maluuba 的愿景与微软的愿景一样——通过创造像人类一样会思考、推理与交流的有文化的机器,来实现更全面的人工智能。通过对人脑与生俱来的能力进行建模,Maluuba 的杰出团队正试图解决语言理解方面的一些根本性问题。这些能力模型包括记忆能力、常识推理能力,以及好奇心与决策能力。我从事人工智能研发已超过 20 年了,这次收购让我对会话人工智能的无限可能充满了期待。
试想一下,在未来,你不用再为找不到人而抓狂,比如没法从公司员工名单、文件、邮件里搜寻到公司里顶尖的税法专家。相反,你可以和具备 Maluuba 机器理解能力的人工智能助理进行沟通,它能立刻回应你的需求。人工智能助理会基于对文件、邮件等内容的深度学习与理解,以符合公司安全标准的方式进行反馈,而不是简单使用当下最常见的关键词匹配去检索文档。随着 Maluuba 不断推动机器文化方面的尖端研发,这只是我们可以想象的数百种可能之一。
Sam Pasupalak 和 Maluuba 的另一位联合创始人 Kaheer Suleman 打造了一支出色的工程研发团队,他们也将成为微软人工智能与微软研究事业部的一份子。相信,我们的携手不仅能让 Maluuba 的开创性成果取得大规模的发展,也能提升我们自身的软件开发能力,让计算机更加自然地进行阅读、写作及对话。
Yoshua Bengio
此外,作为全球最重要的深度学习研究专家之一、蒙特利尔学习算法研究所所长和Maluuba顾问,Yoshua Bengio 也将成为微软顾问,并直接和我互动。我一直非常仰慕 Yoshua 的成就,所以我也很期待与他共事,并受益于他在深度学习系统方面的造诣。
正如 Maluuba 与微软有着高度契合的愿景一样,他们的研究与工程协作方式与微软也十分相像。去年秋天,我们成立了人工智能与研究事业部,将工程与研究紧密结合在一起,从而加速从前沿研究到产品开发的整个过程。Maluuba 也将密切联动研究团队与工程团队,我们期待向他们学习更多的经验。我们的协作方式之一就是为全球科研界提供全面支持,从而推动人工智能系统的全面发展。例如,上个月我们发布了 MS Marco 数据集以更好地服务于机器阅读技术的发展;同样,Maluuba 最近也开放了阅读理解和对话系统的数据集。
我们将在后续几个月分享更多关于 Maluuba 的规划。同时,我想再次强调,Maluuba 将为微软带来技术与人才,并将在助力微软实现让地球上每一人、每一组织都能使用人工智能并从中受益的愿景中扮演重要角色,这让我感到无比激动。