今年的互联网峰会上还有一个细节很有意思,开场主讲人一个是来自百度的吴恩达,一个是来自华大的王俊。前者讲人工智能,后者则聚焦基因工程,这或许成为了人类社会未来发展的两大关键科学之一。如果两者结合,未来我们能活的更健康。
IT领袖峰会又是一次B格爆表的会,BAT包括联想等大佬齐出场,并且很难得的讨论起风口这个问题来。除此之外,今年的互联网峰会上还有一个细节很有意思,开场主讲人一个是来自百度的吴恩达,一个是来自华大的王俊。前者讲到了语音、图像技术、用户行为研究将成为驱动未来的革命引擎。后者则聚焦在数字语言和生命语言的交流、IT和BT(生物技术biotechnology)的融合趋势。
毫无疑问,这对外透露了一种强烈信号——人工智能已经被提到了与基因工程一样高的地位,成为了人类社会未来发展的两大关键科学之一。
一个是顶尖的深度学习专家、被誉为人工智能的泰斗;一个是华大基因首席执行官,是探索生物数字语言的前沿科学家。两个来自不同领域的人,这次却殊途而归的提到了人工智能,并且都指出——不管是基因工程还是网络工程,目前最好的生产力武器以及改变行业格局的就是基于大数据的人工智能。可见,基因工程和人工智能就像打开未来的两把钥匙。
数据的世界呼唤人工智能
多年前,克隆羊多利轰动了生物学界。其实放到IT领域,其实就像是一次简单的复制粘贴。只不过BT以基因信息为基础,IT以二进制的0和1为基础。伴随着生命的密码被解读,在IT领域对于数据的操作,比如存储、改写、复制、粘贴,都可以在生命领域实现。基因是生命体最基本构成单位。每个人身上蕴藏的生命信息基本程序就是生命的语言。如果把每个人的数据都连起来,形成基因组网络,其中的机会不可估量。
生物基因其实是最原始但又是最庞大和复杂的一个大数据,不止记录了个体的生命信息,更记录了一个族群整体的演化历程。 华大基因在尝试用大数据挖掘发现一些罕见病真正解决方案, 并且有一个计划,搜索了100万人基因数据,寻找那些单纯从基因校对来讲他应该单基因疾病,但是非常健康的超级英雄,这些人非常有意思,他们体内有非常明确的致病基因,但是非常健康。 因为体内有另外一套基因保护他。
就像程序我一段出现bug,但是有另外一段修复,就非常健康。如果找出那一段是什么,也许可以找出罕见性疾病的药物。
王俊说,“类似于我们讲的 IT 互联网,如此大的基因网络最终需要人工智能来学习。BT 和 IT 技术殊途同归,无外乎是对数据的改写、备份和还原。”
华大基因最终要做的是需要人工智能来学习,因为这么大的量已经不可能用一个单一模型来解决。当拥有100万人基因测序的时候,离这样的能力很近。
我一直相信科技才是第一生产力,一切商业模式在技术面前都是纸老虎,基因工程和网络工程,看上去风马牛不相及的两个领域,但因为有了大数据和互联网连接, 然后随着IT、BT融合,生物数据和互联网大数据交融是一个非常大的趋势。
怎么融合呢?其实生物数据也是数据,互联网数据也是数据,世界归根结底是数据的,光有数据不行,需要引擎,人工智能是引擎,有了引擎才能消化大数据。数据从量变到质变的过程,大量数据产生,需要人工智能进行挖掘分析提炼,生物也产生数据,随着社会的发展和人类需求的变化数据会越来越多到达一个奇点。
下一个风口指向IT、BT?
IT和BT的融合其实已经实实在在发生,很多公司都已经走了一大段路了。
最著名的Google Venture的投资目的就是让人类活的更久,投资了很多生物、医药等BT方面的公司,google的这种极具前瞻性的投资风格代表了这个融合的趋势。
谷歌2012年投资的23andme应该是基因检测领域非常知名的公司,前段时间著名制药企业 Genentech 向 23andMe 注资 6000万美金,用于分享后者的帕金森氏症患者的基因组数据。它的联合创始人之一 Anne Wojcicki 正是谷歌联合创始人 Sergey Brin 的妻子。
另外一家公司, 曾从 Google 和 Dropbox 获得风险投资的 Bina Technology 近日又再次收获 650 万美元融资。Bina Technology 主营业务是采用大数据的分析方法分析人类基因序列,他们的分析所得将成为研究机构、临床医师等下游医疗服务行业的基础素材。就目前而言,将方向定位人类基因序列分析的美国企业多达 2000 家,这个数字到 2015 年有望达到 8500 家。然而,这些公司在处理复杂的基因数据上都力不从心。
包括23andme在内,这些基因分析公司都能够采集人类基因序列信息并加以应用,推断出不同客户容易患上何种疾病,但其中很多数据并不可用。Bina Technology 希望填补这一空白,成为一个平台、一个数据库,让研究型大学、医药公司、医疗机构等下游机构能够在他们提供的数据之上,进一步摸清基因变异与各种病症之间的关系。
而这个创业团队的平均学识无人能出其右,均是来自斯坦福大学与加州大学伯克利分校的博士,研究方向为大数据或生物信息。
没错,Bina Technology 的目标就是把生命科学与计算机科学融合起来。而这个融合的关键点就是大数据的处理,以及人工智能的发展,而不简简单单是各自的发展,只是在某一个点上的交叉。
百度在这个融合上非常重视,对人工智能下了大注。依靠人工智能技术(百度大脑),在语音、图像搜索方面取得了重大突破,BaiduEye、无人驾驶汽车、百度智能自行车,筷搜等产品不断问世。这些产品建立起来的一个矩阵式、全方位的人工智能服务可能会把整个竞争门槛提到一个新的高度。
百度有很多数据搜集过来是关于人的行为的,而这些深度学习可以使百度了解人们的行为是什么样的,他们倾向于做什么事情,他们喜欢做什么事情。因为百度的数据中心还有很多数据搜集起来,使百度了解不仅仅是人的行为,还有机器人行为。
这些下注和实实在在的布局代表了对这个融合趋势的判断,从各自的点出发,又殊途同归,BT和IT的结合肯定是基于人工智能的大数据处理。
在这么一个大融合的时间点,不止是BT和IT,甚至各行各业都在融合,都在互联网化,也都在大数据化,随着融合的深入,数据量的激增,数据维度的激增,问题也日益突出。目前的解决办法都指向了机器深度学习,以及更深一层次的人工智能。 在这么底层的一个领域都指向人工智能,信息量越大越智能,跨界越多越智能?那是否可以有个推论,人工智能连接一切呢?这种连接可能更底层,更基础,更加的无声无息,也同样可以让体验更好,更智能。
而关于人工智能,吴恩达把这种融合提升了另一个高度。
面向未来,如果想看一下人工智能给我们带来的潜在影响的话,我不得不想到第一次工业革命,第一次工业革命是在英国,最后蔓延到整个欧洲的。我想这次工业革命在当时也是推动了 一些新技术的发展,最初在英国,最后整个欧洲都采用了这些技术,这是一百多年前,快两百年的事情了。
人工智能是否连接一切需要等待时间,但是关于风口,robin哥在大会上又个很经典的说法“风口”那里的人实在太多了,如果你的心态是哪有“风口”就到哪待着去,到了“风口”后又什么都不干,不久就会被人挤跑。所以要看自己喜欢什么、擅长什么,是不是真的能坚持很多年地一直做下去。
作者:topiori