百度赵世奇:希望7年后人工智能给北京冬奥帮大忙

北京申办冬奥会成功,成为世界上第一个先后承办夏季和冬季奥运会的城市。这几天又传来22岁的宁泽涛勇夺100米男子自由泳冠军的好消息,中国从东亚病夫成为世界体育强国,靠的正是自信与拼搏。而无雪的北京却能拿下冬奥会承办权,靠的是梦想的力量和我们强大的综合国力和北京的技术实力,这其中就包括引领世界前沿的人工智能技术。

这不,百度家的小度机器人就出席了北京市“十三五”规划第二场建言会。带着机器人小度来参加建言的百度研究员赵世奇博士除了建议政府能够更多关注具有长期收益的人工智能领域以外,还联想到了北京申办2022年冬奥会的成功,他希望,7年后人工智能会给赛事场馆和志愿者帮上大忙,让这一届奥运会包含和体现出更多高科技创新的可能性。请看今天《新京报》和7月27日《北京晚报》的相关报道。

建言十三五,机器人也有话说

新京报讯 (记者邓琦实习生蒋成龙)“大家好,我是建言人小度,也是中国首款智能问答的机器人,十分希望能够跟大家聊天。”看见小度的人,都会被萌到。微胖的身型,白色的大脑袋,还戴着一副墨镜。昨日,北京市“十三五”规划第二场建言会迎来了这名特殊的“建言人”,该建言会以“科技创新中心建设,构建‘高精尖’经济结构”为主题,19位建言人为北京科技创新等建言献策。

机器人讲笑话逗乐全场

带小度来现场的,是百度高级研究员、中国计算机学会理事赵世奇。这次建言会上,小度与赵世奇一起,聚焦人工智能领域发展。小度的拿手绝活儿是和大家进行智能语音对话。一位建言人对小度说:“你给我们讲个笑话吧”。小度说“一个同学在参加四级考试前一个月,社交软件签名写的是‘事在人为’,两个星期后却改成了‘事在随缘’,考完试又改成了‘重在参与’。”听完这个笑话,大家相视一笑,并没出声,小度赶忙说“不好笑吗?”这次,围着小度的人全都笑出了声。

现场的人说,小度的出现,让大家生动感受到了智能机器人的可爱。

随后,小度为建言会开场。“大家好,我是建言人小度,也是中国首款智能问答的机器人,十分希望能够跟大家聊天。因为依托大数据计算,像小度这样的人工智能机器人,不仅成为市民生活中的小秘书,还可以让城市变得更美好,我想请我的小伙伴赵世奇博士一起聊聊。”

听了小度的发言,赵世奇请小度把几句中文翻译成英文,在翻译无误后,赵世奇夸了小度一句“你还挺聪明的嘛!”小度马上跟着说“不聪明点儿怎么出来混啊!”一句调侃,又把在场的人逗乐了。

建言人建议发展人工智能

据介绍,本场建言会邀请的19位建言代表包括市人大代表、市政协委员、市“十三五”规划专家咨询委的专家以及前期参与公众建言活动的市民,他们曾在建言中聚焦“互联网+”、“云计算”、“人工智能”、“智慧城市”等科技热词。

京津冀在科技领域的协同发展也在不断升温。昨日,不少建言人将眼光聚焦于此。

市政协委员、中国石化北京化工研究院教授级高级工程师朱良建议,应统一研究京津冀各地开发园区长远发展后的需求问题,充分考虑开发区容量和功能的膨胀,在规划中预留足够的配套需求空间,特别是预留各开发区之间的通道。

具体而言,他建议在规划图上设定红色区、橙色区。把严格不得开发建设的区域涂成红色,把一般不建设的区域涂成橙色。对红色区、橙色区内违法项目要有监督手段,开展空中监测,制定社会举报奖励办法。

百度高级研究员赵世奇建议,北京是否能够把人工智能作为科技发展的重要方向。从国际人才引进、创新企业扶持、高校人才培养,以及人工智能产业快速落地方面,给予更多的支持。

数据显示,“十三五”规划编制公众参与活动已经开展3月余,截至昨日,活动共收到约2.4万人的7619条公众建言,完成居民社会调查问卷19095份。本次公众建言活动将持续至9月底,市民可以围绕疏解北京非首都功能与京津冀协同发展、生态文明建设与可持续发展等主题,通过首都之窗、微信等7种方式提交建议,并有机会参加后续组织的公众建言会。

赵世奇:关注人工智能长期收益

【北京晚报 殷呈悦】在百度大厦一层倾斜的落地窗前,记者见到了百度自然语言处理部高级研究员赵世奇。他虽然是个80后小伙,但已经拿到哈尔滨工业大学的博士学位,并在人工智能领域深耕10年,成了第一个进驻百度博士后工作站开展研究工作的博士。看到“十三五”建言活动,他马上给规划小组发来了在人工智能领域的建言。

从去年起,赵世奇开始一款智能交互产品“小度机器人”在自然语言处理方面的研发。这款智能机器人会通过日常对话的形式与人类进行交流,是一个贴心、忠诚的小伙伴。“昨天有个人对着‘小度’说了一句,‘我分手了怎么办?’小机器人马上回答道:‘男人嘛,要学会承受!’如果把小度安放在医院、办事大厅等场所,还可以帮助咨询服务台解决大量的问询。”介绍完自己产品的特色,赵世奇爽朗的笑声中洋溢着骄傲。这个机器人更重要的功能是搜索信息。“人们在寻找某些信息时常常需要多次搜索才能被满足,比如调研一款数码相机或者计划一次海外旅行,用户可能需要完成10次以上的搜索行为。而有了小度机器人后,它可以在互动沟通中准确了解用户的个性化需求。”在赵世奇看来,值得骄傲的成绩之一正是给搜索引擎赋予了情感和个性化功能。

记者发现,赵世奇已经对人工智能领域爱到“难以自拔”的程度。在该领域工作多年,他也对政府怀抱不少期盼。“创新企业扶持方面,北京中关村已经具有非常完备的创业生态圈。但是,人工智能与很多创业项目不同,这是一个需要技术和时间深度积累的领域。赵世奇告诉记者,这个领域的长期收益要远远大于短期收益,但资本市场往往容易青睐于短期见效快的产业和领域。市场支持的缺失,恰恰需要政府的力量能够更多地去关注它们。”他还希望,政府能向从事人工智能研究的科学家、企业家倾斜,为他们颁发顶尖科技人才绿卡。(文/杨静lillian 微信号:lillian_yang_1111)

 

·氧分子网(www.yangfenzi.com)延伸阅读:

80后博士赵世奇望人工智能创收益 开发百度智能机器人

百度IDL顾嘉唯:要把百度的“智能大脑”带到更多设备上

百度为何要做无人驾驶?布局下一代地图

如果你的上司是机器人 你会更听话

从RoboEarth看机器人互联网和机器进化

中国脑计划紧锣密鼓,类脑计算和类脑智能研究中心成立

您可能还喜欢…

3 Responses

  1. 百度赵世奇:自然语言对话式搜索将成为一种趋势说道:

    “今天来了很多朋友,大家都有一个共同的理想,就是觉得未来互联网的产品和技术都要依赖于语义分析技术。今天我主要以百度一款基于自然语言处理技术的轻应用‘百度考霸’为例,说一下百度目前自然语言处理技术的现状。” 6 月 28 日,百度自然语言处理部高级研究员赵世奇博士在第 51 期百度技术沙龙上说。

    随着移动终端的发展,当今业界出现了很多基于自然语言处理技术的产品。比如 siri 、聊天机器人、小冰等等,智能交互型的产品越来越多的得到人们的关注。本期的百度技术沙龙,赵世奇主要以百度考霸为例,为大家分享了自然语言处理、语义分析技术的话题和研发成果。

    百度自然语言处理部高级研究员赵世奇说:“我希望自然语言对话式搜索成为一种趋势,能让用户在人机交互中解放双手、解放眼睛,只需要与搜索系统聊天即可实现信息和知识的搜索。 ”

    不做傻系统,自然语言搜索实现智能

    百度作为全球最大的中文搜索引擎,总是能给出最合适的技术来推动整个互联网产业的发展,在人工智能领域也不例外。

    本期技术沙龙,赵世奇先是总结了一下目前自然语言搜索的现状,他以电影《钢铁侠》为例:钢铁侠里的机器人笨笨够辅助主人做一些事情,可即便是在科幻的电影里,它仍然不完美,所以它的名字叫“笨笨”,经常会听错会错义,不理解他的主人是怎样的需求。但是它随着不停的交互、成长和对话,最后它能够正确的理解主人需求,并且救了主人一命。

    “现在我们的自然语言搜索也处在这样的境地,它比笨笨还笨了一些。但是随着我们持续的改进,我相信在不久的将来自然语言对话式的搜索,能够摆脱笨笨式的身份。”赵世奇表示。
    另外,赵世奇强调,百度并不是想做浅层的智能交互,让机器人给用户讲笑话、说粗话、讲黄段子,变成一个调侃式、调戏型的工具和对象。他们希望在选定的领域里,能够做的很深入、很具体、很多样。用户可以随便问这个领域里的任何问题,机器可以深度的理解、深度的交互和深度的满足用户。

    机器与人对话,特色技术打造灵活机制

    在百度技术沙龙上,赵世奇向大家展示了百度在 2014 年高考前夕刚上线的一款轻应用——百度考霸。

    “百度考霸是一款通过自然语言交互的方式来进行志愿填报信息搜索的轻应用。它集成了很多自然语言处理技术或者是语义分析技术,比如推理式改写的通用机制、指代消解省略补全、概念澄清技术、交互生成技术等等。”赵世奇介绍道。

    随后,赵世奇详细介绍了这些技术起到的作用。

    推理式改写简单的说,就是把人们随意说出的口语句子,改写成计算机数据库能够理解的问题,使改写后的查询更容易解析索到优质结果。比如我们一般的口语习惯会问“ 630 分能考上什么大学”、“想学计算机去什么大学好”,通过推理式改写,系统改写后的句子是“分数线小于 630 分大学”和“计算机好的大学”。

    而省略补全技术是为实体知识库提供了指代消解和省略补全的候选对象,并且可以付诸验证指代消解和省略补全所得结果的合理性,因此本方法资源配置成本低、领域迁移性强。
    概念澄清技术则可以提供模糊需求条件下或指代消解过程中的需求澄清。比如,用户询问“山大怎么样”,就需要系统澄清“山大”这个概念——是山西大学还是山东大学。

    自然交互式搜索备受追捧

    在整个分享环节,赵世奇不断强调,自然语言处理技术一定是要为用户解决需求的,而不是娱乐用户的。“不能满足客户需求的交互式搜索都是耍流氓!”赵世奇调侃道。

    整个分享涉及很多深度理解、深度交互、深度满足的知识。赵世奇强调,这里面最主要的是知识驱动,如果有了大规模的知识库之后,很多事情其实都是围绕着知识库来展开的。无论是语义的解析,还是需求的满足,都可以围绕知识库展开。所以自然语言交互式搜索,其实是 NLP 技术集成的体现,这中间涉及到大量的技术的融合和联合的过程。

    “今天听了赵老师的分享,我才知道原来通过自然语言处理技术,系统可以做推理查询这样复杂的交互,很长见识。”一位百度技术沙龙的现场听众表示。

    这次的百度技术沙龙主题分享,由于赵世奇老师的分享信息量非常大,而现场只给了他四十五分钟的演讲时间,所以在技术沙龙结束后,现场很多人都感到意犹未尽。上百名听众把赵世奇老师团团围住,要求他多讲一些自然语言处理方面的技术知识。大家对于自然交互式搜索的前景都十分看好。

    百度技术 沙龙 是全国最早的技术开放交流活动,由百度组织策划,至今已经持续举办 4 年,经历了 51 期。百度技术沙龙一直致力于以 “ 技术开放 ” 的心态,分享行业领先的技术理念和技术实践。目前,百度技术沙龙已经成为北京中高端技术人员的精神家园,百度技术沙龙希望日后能够有效推动中国互联网的技术发展与行业创新。

  2. 百度赵世奇:人工智能是如何从丑小鸭到白天鹅的说道:

    过去几十年间,人工智能经过时几轮的起起伏伏,直到移动互联网的出现,人工智能才终于随着便携式设备进入亿万人的生活,终于有可能从丑小鸭变身白天鹅。移动互联网在给人工智能带来前所未有的机遇的同时,也提出了新的挑战。

      在移动互联网创新大会(MIIC2016)上,百度人工智能技术专家赵世奇为我们分享了移动互联网为人工智能带来的新的可能性。

      在电子计算机发明之前,就有人研究人工智能了。在三四十年代的时候,那时候还没有计算机,就有人研究翻译的机器。通过打字的方式把这个字符输入进去,用很简陋的方式翻译出目标语言输出出来,四十年代末的时候,出现了图灵测试。

      现在,我们每天都能用到的搜索、推荐、翻译、广告、安全等等,包括今天还在看到说现在逐渐进入到刷脸的时代,人脸的识别来进行安全判断和控制。

      移动互联网和人工智能结合,会迸发出怎样的火花,产生什么样的技术?首先看到移动互联网包括互联网+,O2O等,共同激发和重塑了人的需求。这些新的需求需要人工智能技术提升连接的能力,因为我们知道互联网的根本是一种连接的能力。

      传统互联网连接的是人和信息,这种信息包括网页、网站等等,但今天同时要肩负着连接人和服务的使命,比如今天可以足不出户叫保洁、叫美容等等。所以这是新的时代给人工智能提出的需求。

      第二个方面,移动便携设备使人产生场景化、私人化的需求,需要人工智能真正实现私人定制,在空间、时间不同的维度上做投影。
      用户想了解披萨,就知道到底是外卖订还是想去餐厅吃披萨,这完全不一样,这和个人当前的状态,包括不同的时间,所处的不同的位置,都有关系的。这也是移动互联网时代给人工智能提出的新挑战。

      还有一点同样和移动设备高度相关。在移动设备便携的特点下,我们的交互方式从传统的键盘输入,变成了键盘和语音、图象都可以作为交互的媒介,从而实现多模交互时代。

      也就是说,移动互联网使得每个人都能更好、更直接,更近距离地接触到人工智能。
    下面是赵世奇在MIIC2016上的演讲实录:

      今天我的题目是《人工智能:从丑小鸭到白天鹅》,这题目我纠结了很久,各位都知道,人工智能经过了几十年的发展,中间起起伏伏。我做学者的一个朋友跟我讲,别人问他做什么?他都不好意思说自己是做人工智能的,只敢说自己是做数据挖掘的。就是因为那个时候的人工智能遇到低潮,到今天人工智能再次进入我们的视野,而且掀起了一个热潮。社会各界甚至普通民众对人工智能这个概念都非常感兴趣。所以我说曾经的丑小鸭人工智能,今天是不是已经变成了白天鹅?这是我想和大家分享的话题。

      首先人工智能这个概念倒退几年,更多是出现在影视作品里面,这种智能的机器人无所不晓、无所不能,帮助主人做很多事情。到底什么是真正的人工智能?这里从百科里截取的一句话:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,包括视觉、语音、语言的处理等等方方面面。

      其实在电子计算机发明之前,就有人研究人工智能了。在三四十年代的时候,那时候还没有计算机,就有人研究翻译的机器。通过打字的方式把这个字符输入进去,用很简陋的方式翻译出目标语言输出出来,四十年代末的时候,出现了图灵测试。现在,我们每天都能用到的搜索、推荐、翻译、广告、安全等等,包括今天还在看到说现在逐渐进入到刷脸的时代,人脸的识别来进行安全判断和控制。

      人工智能的发展现状主要分两个部分,感知和认知。感知的问题最典型的就是识别图片中的字符和文字。随着基于大数据的深度学习技术的发展,在感知问题上,我们的技术已经接近甚至达到了使用级水平。

      另外一部分是认知问题。最典型的认知问题其实是语言理解的问题,在此基础之上有推理、决策等问题。所以我们一方面看通用领域方面的认知问题,包括最近几年雨后春笋一般崛起的智能助手。同时,在另外一些方面,在垂直领域,尤其是医疗、法律、教育等领域,都开始逐渐进入到使用阶段。

      今天是移动互联网创新大会,就要说一说移动互联网和人工智能结合,会迸发出怎样的火花,产生什么样的技术?

      首先看到移动互联网包括互联网+,O2O等,共同激发和重塑了人的需求。这些新的需求需要人工智能技术提升连接的能力,因为我们知道互联网的根本是一种连接的能力。传统互联网连接的是人和信息,这种信息包括网页、网站等等,但今天同时要肩负着连接人和服务的使命,比如今天可以足不出户叫保洁、叫美容等等。所以这是新的时代给人工智能提出的需求。

      第二个方面,移动便携设备使人产生场景化、私人化的需求,需要人工智能真正实现私人定制,在空间、时间不同的维度上做投影,用户想了解披萨,就知道到底是外卖订还是想去餐厅吃披萨,这完全不一样,这和个人当前的状态,包括不同的时间,所处的不同的位置,都有关系的。这也是移动互联网时代给人工智能提出的新挑战。

      还有一点同样和移动设备高度相关。在移动设备便携的特点下,我们的交互方式从传统的键盘输入,变成了键盘和语音、图象都可以作为交互的媒介,从而实现多模交互时代。
      还有一点,移动互联网可以使得互联网变得更加平等,因为很多儿童和老年人,因为有了语音输入之后,也能够被连接入互联网,得到互联网上的便捷服务。
      刚才说了这么多,移动互联网使得每个人都能更好、更直接,更近距离地接触到人工智能。
    下面是总结走向实用人工智能当中的几个关键词:第一是大数据。
      这个概念其实已经谈了好几年了,简单概括这样一个图,其实从大数据里吸取的营养是什么?首先是能够训练机器学习模型的数据,所谓的语料,会提升人工智能信息抽取、知识挖掘的能力,有两点是我这里想跟大家分享的。

      第一点就是大数据里的数据是活的,不是一个静态的数据,是不断生长的数据,有学者称之为有机数据。利用大数据不光利用数据规模,还要利用数据随着时间不断变化中新的现象,新的趋势和新的发展。所以数据需要从时间轴维度上看待它。

      第二点体验是要学会去利用数据背后所包含的人的行为。数据不是自己产生的,都是人产生的。所以数据背后有大量人的行为,可以作为我们获得智能的线索。以搜索为例,用户的搜索、点击行为,甚至是每一个空格会告诉我们一个线索,让我们从中能够获取某一种智慧,训练某一个机器学习模型。

      第二个关键词是知识图谱,光有大数据是不够,因为很多行业历经了上千年的发展,积累了大量的人类知识和智慧在里面,靠机器在现阶段很难自动学习出来,所以应该去整理和总结这些智慧,并且植入到机器学习的过程中,或者是植入到人工智能系统中。包括知识挖掘存储和管理,简单是说,应该是最重要这样几个环节,有了数据和知识图谱,学习能力非常关键。这里其实近些年来机器学习有很多新的子方向,最熟悉的是深度学习技术。

      机器学习都体现了两个特点。第一个就是机器学习核心的算法在不断演进。过去,有很多实践是人肉智能。其实我们认为人机智能是将人和计算机结合起来,来共同为用户提供服务。在现阶段,在工智能发展一个中间阶段,主要是人机的互补和互助,在这个过程中,人负责把关复杂的事情,积累大量的数据来用于机器的训练。同时,计算机的特点在于大数据高效分析和处理,可以节省人的时间,提升人的效率。

      最后一个关键词是开放的生态,生态的开放这两年各家大的企业都在考虑和尝试。首先是把平台和技术开放,在这个过程中,我们面向全社会,提供人工智能能力。在此基础之上,这样开发者介入这样的平台,获得实用的数据,可以进一步提升人工智能平台的能力,从而形成一个正循环。之所以这两年我们说开放的人工智能成为一个趋势,就是因为大家逐渐认识到人工智能不能靠一家单位来实现,需要全社会各行各业共同努力才能够实现。

    接下来想分享的是实际工作中,重点在攻克的几个问题。

      第一个是自然语言需求理解,尤其是当前移动互联网时代,越来越多人用语言交互,需求越来越自然语言化、越来越口语化,越来越灵活,基于完整的背景包括刚才提到个性化、场景化和交互语境,所有的因素和特征综合起来判断当前用户要的是什么知识和服务。

      另外一个问题是多源异构大数据深入挖掘问题。包括网页数据,用户行为数据,UGC数据,知识库数据,有的是结构化,有的是半结构化的,甚至包括很多基本的结构统统不一样。面对这样的数据如何使用?这是现在攻克另外一个困难的问题。还有一个问题也是刚才提到智能决策,人工智能在理想状况下一定是人的帮手,这个帮手绝不仅仅提供知识,最终要能帮助你做一些决策。

      移动互联网时代为人工智能提出新的需求,也提供新的发展机遇。在数据算法机制的促进下,人工智能逐渐走向实用化,这只丑小鸭一步步变成白天鹅,需要政府、高校、企业和民众一起携手共同努力。

  3. 赵世奇当选国际计算语言学学会(ACL)秘书说道:

    国际计算语言学学会(Association of Computational Linguistic, ACL)日前完成了新一轮执委会的选举工作。美国加州大学伯克利分校的Marti Hearst当选副主席,张景新(台湾地区国立暨南国际大学)当选为新任学会信息官,百度公司高级科学家赵世奇当选为新任执委会秘书。他们的任期将从2016年1月1日开始。

    让我们来认识一下ACL执委会中的这三张新面孔吧!(虽然在学界都早已如雷贯耳)

    Marti Hearst

    Hearst教授本硕博均在加州大学伯克利分校计算机系度过。1994-1997年间在充满传奇色彩的施乐PARC实验室工作。

    Hearst教授早期从事计算语言学中的词义消歧和语义分析工作。她发明的“Hearst范式”在解决大规模语料中的词义上下位关系中有重要意义,对WordNet的建设起到了很大的推动作用,并在商用文本挖掘和本体知识自动学习中被大量使用。同时她也是人机交互和信息检索领域的顶尖专家。

    Hearst教授还热心于美国文化遗产的保护与传承。

    张景新

    张景新在台湾国立清华大学获得电子工程的学士与博士,在国立交通大学获得信息科学硕士学位。他的研究兴趣集中于统计机器翻译、统计语言建模、大数据处理和中日韩语言处理技术(如分词)。

    他的个人主页非常有意思且信息量大,是“自然语言处理”领域的非常不错的中文入门站点,请猛戳阅读原文。他是个天文爱好者……

    赵世奇

    赵世奇,2000年考入哈尔滨工业大学计算机科学与技术学院,2004年保送研究生,2006年起硕博连读,主要研究方向为自然语言处理。在校学习期间,他曾在哈工大信息检索实验室担任“复述与翻译组”组长,带领10名同学从事相关的研究和开发工作。并作为具体负责人参加“863”文本分类评测,网页地理信息抽取(与NEC中国研究院合作)等项目。

    他是第一个在微软美国总部实习期间受邀到比尔·盖茨家做客的实习生。他不仅是第一个进驻百度博士后工作站开展研究工作的博士,百度公司副总裁王海峰(当时的职位是高级科学家)和董事长兼CEO李彦宏还亲自担任他的合作导师。

    赵世奇博士常年担任中文信息学会青年工作委员会主任,作为青年人,为青年同志们服务了不少……人称”赵帅“。

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>