谷歌全力打破语言障碍 研究自动化机器翻译

谷歌翻译团队已经开发了一个应用,这个应用能把智能手机变成会“走路”的翻译机。

谷歌矢志打破语言障碍 研究自动化机器翻译

 氧分子科技 刘翔 9月17日编译

语言障碍是否能被打破?在谷歌看来,这肯定是可以做到事情。

据德国《明镜周刊》报道,在一名来自德国的计算机科学家的领导下,谷歌正在开发一种通用翻译工具的进程中取得进展。不过,谷歌在这个项目上正面临着即将来临的潜在竞争对手,那就是微软和Facebook。

当科幻小说家构想人类的未来时,许多有关改善世界的想法总是会重复不断地迸发出来,比如说无限可用的能源和光速旅行等。而在这些想法中,创造微型计算机来作为通用的翻译工具以消除所有语言障碍也跻身其中。

终结语言不通的历史

在以上所述的三种梦想中,至少最后一种是谷歌正计划将之变为现实的事情。在谷歌内部,有一位来自德国西南部城市埃朗根(Erlangen)附近一个小乡村的计算机科学家正在负责这个项目,他就是现年41岁的弗朗兹·约瑟夫·奥驰(Franz Josef Och)。

长期以来,奥驰一直都集中致力于实现一个目标:开发出一种完美的翻译计算机,这种计算机是如此不显眼而又如此之快,“以至于你几乎不会注意到它,只有当它在你的耳中低语时除外”。在他的理想中,这种设备能迅速翻译任何文本、网站内容或是对话内容。

对奥驰来说,通用翻译工具不只是意味着旅行者将可在没有语言障碍的情况下四处旅行,也不只是意味着许多口译工作人员将会面临黯淡的未来前景,而是具有一种大得多的重要意义:这是一条通往人工智能的道路。从青少年时期开始,他就一直都梦想着将来有一天可以创造出各种能模仿人类专有属性的机器。

后来奥驰就学习了计算机科学专业,并最终拿到了博士学位,他的毕业论文就与人工智能有关。随后,他被美国国防部高级研究规划署(Defense Advanced Research Projects Agency)聘用,在加利福尼亚州展开自己的工作。在2004年,奥驰接到了来自于谷歌联合创始人拉里·佩奇(Larry Page)的电话,后者询问道:“你想不想做大?”然后奥驰就成为了谷歌翻译(Google Translate)部门的负责人。

对于谷歌这家互联网巨头来说,畅想梦幻般的未来正是其业务模式的一部分内容,无论是无人驾驶汽车还是有关延长人类寿命的实验都反映了这种模式。虽然到目前为止谷歌翻译还几乎没有什么成果,但很可能没人能比奥驰以及他领导下的团队拥有更远大的抱负:他们想要终结神话传说中从巴比伦通天塔倒塌以后开始的语言不通的历史。

免费提供

这位德国计算机科学家及其团队已经取得了一些重大的进展。现在,谷歌翻译已经可以在71种语言之间进行互相翻译,例如将英语翻译为德语或是将冰岛语翻译为日语等。

举例来说,当来自于《明镜周刊》的一篇文章使用谷歌翻译时,用户在一转眼的短短时间里就能获得这盘文章的法语版;意大利语的网站也可以只需点击一下按钮就能以德语显示;用户只需用智能手机给日语写成的一个火车站指示牌拍照,谷歌翻译应用就能自动识别图片上的文字并进行翻译。

去年,谷歌翻译的用户使用量大约为2亿次。到目前为止,这项服务还是免费的。但对于一项自动化的翻译服务来说,跨国公司将会乐于使用这种服务,从而为其带来很高的价值,这意味着在未来谷歌几乎肯定可以通过这种翻译工具获取大量收入。

但就目前而言,谷歌的目标还是完善这项服务,并以通过智能手机提供该服务为发展道路。谷歌翻译团队已经开发了一个应用,这个应用能把智能手机变成会“走路”的翻译机,到目前为止已可处理二十余种语言的翻译任务。这个应用的表现非常好,前提是句式相对简单。举例来说,如果有人想在北京告诉一名出租车司机说他急需到一家药店去,那么只需要对着智能手机说出某种语言(比如说德语),然后手机就会用中文来重复他的话,准确地说出:“请带我去一家药店。”

奥驰觉得,这个应用现在仍旧“略显缓慢和笨拙,因为你必须要按下按钮”才能进行翻译。此外,翻译的质量也并非总是很好。但就在几年以前,如果他预计谷歌翻译能做到今天的事情,那么人们肯定会说他是疯了。

量子跃迁般的重大突破

在数十年以前,IBM就为自动化翻译奠定了基础,但当时该公司所从事的项目毫无进展,不久以后就被放弃了。也正因如此,在奥驰及其同事在谷歌开始展开相关工作的头几年时间里,自动化翻译还只是一个“纯粹的研究项目”。但在最近,他们已经取得了重大的进展;按奥驰的话来说,这种进展可以说是一种“量子跃迁”般的重大突破。

谷歌翻译团队的工作地点是在该公司位于硅谷的总部园区,这支队伍的规模已经扩大了很多。在这个团队中有几位德国计算机科学家,但却连一个纯粹的语言学家也没有,就连奥驰本人也并非真正有天赋的语言学家。相反的,奥驰说道:“我在学习语言时总会遇到麻烦,这也正是机器翻译的美妙之处:最重要的事情是擅长数学和统计学,然后又会编程,那就可以了。”

开发词典、定义语法结构以及制定正常情况下翻译程序所需要的所有规则以模仿人类翻译,这几乎不是谷歌翻译团队所从事的工作。事实上,这种规则经常都会由于太过灵活而令计算机无从下手。举例来说,在英语和德语中,形容词是放在名词前面的;但在法语中,通常情况下则是反过来的。其结果是,翻译程序很快就会“迷失在翻译中”。

谷歌团队所强调的是自己最为了解的东西:海量的数据及其相关相关统计信息。“基本上来说,我们的系统正在做的事情就是把现有的译文关联起来,然后多多少少地靠自己来学习如何利用数之不尽的文本来进行翻译。”奥驰说道。现有的数据量越是庞大,那么这个系统就能越好地运行,这也正是为何翻译计算机只有在互联网出现以后才有可能诞生的原因所在。

远不够完美

谷歌翻译服务的算法能在杂乱无章的信息中进行搜索,收集相关数据并在这一过程中进行学习。举例来说,当谷歌翻译程序接到一个任务,需要把一句法语翻译成德语时,那么这个程序就会搜索可与这句话相匹配的已知短语,然后计算出如何基于这些信息来最好地组织一个新的句子。

这种方式经常都有很好的效果,但距离完美则仍很遥远。对于自动化的翻译程序来说,语法、语调和歧义性仍旧是一个重大的问题。在很多情况下,通过翻译程序来翻译的信息能被人理解,但对于语言学家来说则与噩梦无异。毕竟,机器不可能对美学有任何感觉。

那么,谷歌是否需要教会这个程序拥有自己的创造力,才能真正取得成功呢?奥驰对此作出的回答是否定的,指出这实际上是个事关“更有效的学习”方法的问题。换而言之,计算机需要掌握的是模仿的艺术,而并非具备创造力。

当两种语言之间的结构相似且可用数据数量庞大时,谷歌翻译通常能有更好的表现。举例来说,英语和西班牙语之间的互译就是如此。但是,英语与日语之间的互译则没那么好。“不幸的是,英语和德语恰好是难以互译的一对语言。”奥驰说道。“这真让我头大。”

不过,谷歌到底想要利用谷歌翻译服务来做到什么事情呢?这家公司是不是想要在人际交流中占据垄断地位,并在全球互动的领域中树立自己的霸权?

竞争对手的崛起

奥驰对这个问题也不太清楚,他表示有关商业的事情并不在自己的考虑范围之内。但他说道:“机器翻译能让许多人获取许多信息,这将令其他许多事情变成可能。”他还解释道,间接效益才更重要。

与此同时,谷歌在这个领域中正面临着越来越大的竞争压力。几个星期以前,Facebook已经收购了一家小型公司,后者已经开发出了一种用于自动化翻译的系统。这家社交网络巨头想要利用这个系统来为用户之间的交流提供便利,因其10多亿用户分布在200多个国家中。

欧盟也已经开发出了自己的自动化翻译程序MT@EC,但这个程序主要以处理官方术语为主。受预算削减的影响,欧盟很可能不得不在未来几年时间里裁减10%的翻译人员。

微软也已推出一个翻译项目。在去年秋天,微软研究部门全球负责人里克·拉希德(Rick Rashid)在中国召开的一次会议上宣布了这个项目的成功。当时他用英语讲话,而一台微软计算机同时将他说的话翻译成普通话,而且是以拉希德自己的声音说出来的。从这一点说来,至少微软的这个翻译程序已经沾染上了一丝人性。

您可能还喜欢…

1 Response

  1. 2016 年 04 月 20 日

    […] 谷歌全力打破语言障碍 研究自动化机器翻译 […]

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>