开源大势降低技术门槛,人工智能企业更依赖大数据

近年来,各大科技巨头纷纷开源人工智能技术,典型的例子有谷歌有Facebook和微软等等。技术的开源为其他希望搭上智能化快车的企业带来了好处,一些企业甚至开始认为:已经不再需要再跟这些科技公司合作,购买其AI技术,因为目前开源的技术已经足够。那么,提供AI技术的公司还能靠卖技术挣钱吗?

开源大势降低技术门槛,人工智能企业更依赖大数据

美国巴布森学院(Babson College)管理与信息科学学院的教授,MIT 院士,德勤资深研究员Thomas H. Davenport 最近有一个新发现:并不是所有想要使用人工智能的企业都会跟提供技术的公司合作。

为什么,因为有免费的开源算法可用。

靠销售AI软件来赚钱变得越来越难

Thomas以一家向他咨询的出版公司为例,这家公司希望能在产品的数据化和情景化中使用人工智能技术,但是,跟其他纷纷与IBM Watson合作的竞争对手不一样,这家出版公司并没有打算从IBM购买认知技术。

他们说:“我们认为AI软件的市场是迅速商品化的,我们能够以更低的成本来获得所需要的(AI)能力”。

这家出版公司几位经验丰富的经理还提到,他们认为可以利用开源的人工智能软件来降低成本,现在可以选择的有好几种。另外,很多开放资源提供者并不是小企业,它们可都是谷歌、Facebook、微软和亚马逊这样的巨头。

Thomas说:“刚听到这样的观点时,我略微有一点意外。智能技术现在难道已经那么便宜,那么开放了吗?”

在一个已经变得相对更新的市场上,所谓的认知软件市场要怎样进行商品化?为什么深度学习和机器学习的开发者会进行开源?如果真的比不上免费的软件,Watson为什么可以为IBM带来100亿以上的收入。

首先,从为什么AI技术,也就是上文所说的认知技术为何会商品化这一方面,可以得到一些启示。

现在,软件开发中有一股强大的趋势——在向“微服务”发展,这种“微服务”在小型的功能块上处理运算,然后得到结果。这和传统的“API”或者应用程序交互界面的工作方式一样。由于这些都是小型的功能模块,比起大型的软件单元,企业更难为此付费。因为都是小型的和模块化的,所以这些企业会租用多个软件开发者开发的东西,而不是直接从大企业购买。

这几乎就是认知软件领域过去10多年所发生的事。现在开源库很多,其中不乏一些拥有通用认知功能的算法,比如神经网络、深度学习、语音解析和识别、图像识别等等。

一些库已经开源好几年了,谷歌、微软、Facebook和亚马逊都是最近一两年才开源。通常,通过这些开源库供应商的云平台,可以使用这些开源工具(这样一来,开源的公司至少还可以挣一点钱)。还有另一种方法,就是通过编程网站,比如Github来使用这些开源库。

理想的情况是,如果多家公司和大量的程序员都在使用某一家公司的开放资源认知工具,那么很有可能,软件将会变得标准化,另外,把这些工具嵌入到公司的其他产品中,也会变得更容易一些。

即便是为 IBM 带来丰厚收入的Watson也在走开源的道路。据统计,在Watson 开发者云上,现在有近20个API是可用的。另外,这个数字是不断变化的,因为会不断增加新的API、测试版会下架以及相关的API可能会被整合。

Thomas说,考虑到认知工具商品化的速度非常快,不久后,更多Watson的API进一步开源的话,我一点也不会觉得惊讶。

开源大势降低技术门槛,人工智能企业更依赖大数据

另一个驱动商品化的因素是“Bots”,也叫智能人机交互API,或聊天机器人,它通过文本或者声音的输入,允许人和程序间进行对话式的交流。Bot想要成功的话,首先要把语音转化成文本,然后分析分本,理解其含义。这听起来似乎很难,但是许多同类的公司已经发布了自己的Bot AI软件开放资源,并把Bot加入到了自己程序的交互中。很快,这一技术就会变得很普遍。由于Bot只是一个交互界面,一种像打字或者点击一样的东西,只不过更加容易一些罢了,所以没人会愿意在这个技术上花太多的钱。

以上这一切意味着,靠销售AI软件来赚钱会变得越来越难。当然,对于没有数据科学家的公司来说,会需要许多外部的建议。公司也需要去研究在自己的业务中哪些部分使用这些工具比较好。

Thomas说,我认为,会有一些高度定制化的AI解决方案,它们会是非常详细和具体的,并且通过开放资源就能获取。比如,能探测到欺诈的图像分析系统。

但是,总体上,拥有AI技术的软件会越来越多,而且都是免费的。如果你的公司知道做什么,怎么使用,或者怎样把其加入你的业务中,你就能挣钱。如果只是打算卖AI软件,收益可能就不会那么好了。

技术门槛降低,数据门槛变高

虽然算法的开源降低了技术门槛,但是在智能产品的开发中,只有算法是远远不够的。《财富》网站在7月11日一篇名为《为什么说数据是原油?》的报道中提到,只有拥有了数据,人工智能才会腾飞。

风险投资公司Bloomberg Beta的合伙人Shivon Zilis在评价的数据的价值时说:“数据是新的原油”。她认为,虽然谷歌、Facebook和亚马逊对人工智能软件进行了开源,任何工程师都可以获得代码并开发新的应用程序,但是,大公司并不会公开必需的数据。

谈到大公司开源软件的原因,她认为,这些公司正在通过开放AI软件工具包来招纳更多的人才。所以,如果真的要竞争,公司拥有的数据实际上比开源的软件更加重要。

IBM Watson 数据处理服务部门的总经理David Keeny说:“数据会成为主流。此外,现在全世界的数据,只有20%在互联网上,剩下的80%都被各大公司和组织占据。”

谈到数据,希望在产品中加入人工智能技术的公司又分为两种,一种是有数据的,另一种是无数据的。有数据的是那些长久以来注重收集数据的老牌公司,比如医院;没有数据的通常是许多初创企业。

有数据的公司在智能化的道路上要走得容易一些,以自己手上的数据为资本,他们可以轻松地与拥有强大算法计算的公司达成合作,这种模式最典型的便是DeepMind与英国全民医疗体系(NHS)的合作,两家机构最新的技术成果是使用计算机视觉来诊断眼疾。

没有数据的初创企业也存在机会,那便是在“无数据问题”的环境,比如日程安排这些还没有公司取得巨大进展的问题处理上。

国外媒体Verge报道说,像X.ai这样的初创企业并没有谷歌在Gmail上累积的海量数据,但也开发出了智能化的日程安排软件,并获得商业的成功。 通过这一案例,Verge认为,初创企业可以聚焦于特别小的领域,比如X.ai关注日程安排的智能化。这是一个没有数据的人工智能企业取得突破的途径。

【文/胡祥杰 新智元(微信号:AI_era)】

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网(http://www.yangfenzi.com)延伸阅读:

➤ 行为心理学家使用迷宫来测试人工智能,以前只能玩老鼠

➤ 为什么很多优秀的软件公司和开发者愿意开源和共享?

➤ Google Angular 中文网站上线发布,开源推动互联网技术的发展

➤ 惠普5000万美元战略投资大数据平台Hortonworks

➤ 思科批Facebook开源交换机:隐藏成本的山寨机

➤ 用时空大数据量化世界:百度科学家眼中的复杂中国

➤ 李智勇:大数据的应用难题,是否该建立数据“公地”

➤ 诺蓝:大数据创业,数据哪里来?需要跨过几道坎?

➤ 雷鸣对话吴恩达:超级大咖深度解析人工智能的发展现状与未来

您可能还喜欢…

1 Response

  1. 阿里巴巴 CTO 行癫:开源有意思说道:

    2017云栖大会,阿里巴巴集团 CTO 兼阿里云 CTO 行癫就开源谈了一番他的看法。
    — 老王

    本文导航
    ◈ 开源的核心是连接,社区的根本是连接04%
    ◈ 阿里为何拥抱开源30%
    ◈ 积极回馈开源45%
    ◈ 开源之路81%
    ◈ 结语95%

     作者 | 老王
    2017云栖大会,阿里巴巴集团 CTO 兼阿里云 CTO 行癫就开源谈了一番他的看法。

    行癫在阿里历经了从技术到商业,又从商业到技术的过程,十多年的阿里生涯,让他对开源、技术和商业有了深刻了解。

    开源的核心是连接,社区的根本是连接

    行癫说,阿里巴巴的平台将“消费者和商家连接在了一起,这个平台不仅是个渠道,也从消费者获得了非常多一些反馈,能够快速的根据消费者的需求,来做出满足消费者要求的一些产品。我们回过头来想一下,开源社区,非常像这个模式。”

    这个商业模式,其实就是将相关的人、物、关系连接到了一起,与开源的道理是一致的。

    行癫认为“开源要做好,它最重要、最核心的一点,是把相关的一些开发者、用户,通过软件、工具和平台连接在一起了。”

    纵观那些发展的比较好的开源软件,都是通过开源软件、通过开源的模式和开源的平台,将最优秀的开发者联系起来,将最有价值的软件用户连接起来。

    互联网的本质是连接。没有互联网之前,所有的行为、所有的商业都是单向的;有互联网之后,非常非常多的连接就产生了。所以对于开源,行癫认为它“是根植于互联网的,有了互联网技术平台之后,开源能够做得更好。”

    开源是生长于社区土壤中的,而社区就是一种将参与者连接起来的机制。首先通过将人连接起来,然后才能逐步考虑将来的发展,考虑如何发展和进行商业化发展。

    一个开源软件在诞生之初,有可能只是表达一下对技术的理解和看法,也有可能只是解决某个痛点——大多数情况下是自己的痛点,还有可能只是好玩。至于将来能走多远,能否得到社区的迎合,能否发展出一个生态,甚至成为商业新动力,在最初往往并没有很远的计划和远景。

    但是,在建立连接后,有了一个社区的土壤之后,就有了成长为一棵大树、一片森林的可能。“把人连接在一起,然后后面才是讨论核心问题,和怎么样进行商业化”。

    而现在的云栖大会“也是一个连接”,通过网上直播,中国大概会有一千万左右的开发者会来参加这个云栖大会,所以“云栖大会把中国最具有活力的一群开发者,全部连接在一起了。今天这种形式的大会,本身就是一个对开发者来说,一个最重要的纽带。”

    阿里为何拥抱开源

    阿里巴巴最初是采用商用软件做解决方案,基于小型机、企业级的基础设施。阿里巴巴的平台三个比较大的特点,“互联网级的规模、金融级的稳定性、企业级的复杂程度。”在这种情况下,一方面,如果继续用 IOE 基础设施,随着业务规模的扩大,将来根本无法覆盖剧增的成本。另外一方面,商用软件的支持情况也难以满足业务的增长带来的各种需求。

    因此,阿里巴巴发起了去 IOE 行动,全面投向开源解决方案,用开源软件构建了满足其体量和需求的基础设施。在这个过程中,阿里巴巴一方面大量采用开源软件替代传统的 IOE 基础设施,另外一方面也要面临一些前所未有的需求。

    “阿里巴巴应该是最早把这么复杂的一个应用系统,全部放到开源社区的应用上的。”因此,在规模扩大了到开源软件原来很少涉及的数量级时,就会发现很多之前隐藏的场景问题。在这其中解决了无数的问题,因为面临的环境跟别人不一样,面临的要求也跟别人不一样。阿里做了非常多的工作,把他们的互联网的架构中现在社区不具备的一些功能,都纷纷补上去。自己开发了很多的中间件去满足这些功能需求。

    积极回馈开源

    在全面投入开源的怀抱后,阿里也积极回馈开源社区,真正使自己成为开源社区的一份子。这可以从近年来阿里加大对开源社区的赞助、代码的贡献、开源社区的扶持,以及鼓励技术人员走出去等举措上可以看出来。

    在本次云栖大会上,阿里巴巴宣布了正式发布了 OpenMessaging 和 ApsaraCache 两个开源项目。此前,阿里巴巴捐赠的开源的 RocketMQ 已被 Apache 基金会接纳为全球顶级项目。

    “开源和阿里巴巴都根植于互联网,有了互联网技术平台之后,开源和商业将在未来相当长的时间内保持平衡的发展。”行癫表示。

    据悉, OpenMessaging 项目是由阿里巴巴发起,与雅虎、滴滴出行、 Streamlio 公司共同参与创立的分布式消息中间件、流处理领域的应用开发标准,目前已正式入驻 Linux 基金会,这也是国内首个在全球范围内发起的分布式消息领域的国际标准。

    该标准可以不受编程语言限制,能满足企业对扩展性、伸缩性、隔离和安全的要求,可提供大规模的工业级支持,支持标准参照点的添加与标准化测试,开放接口便于对其他不同标准的接入,适用于金融、电商、物联网、工业互联网等行业。

    “OpenMessaging 希望成为全球化、无国界、无公司边界、面向云和大数据、多行业领域的一站式方案标准,这也是阿里巴巴第一次在国际社区进行的主导和探索。” 项目负责人蒋江伟表示。

    同时,在云栖大会现场,阿里云数据库负责人余锋与 Redis 创始人 Salvatore 共同宣布 ApsaraCache 在 Github 上正式开放下载。ApsaraCache 是阿里云数据库 Redis 版的分支,适用于更大的数据规模和更多的应用场景。

    “ApsaraCache 项目开源是一件非常好的事情,将能够吸引全世界更多 Redis 核心专家参与,进一步提升产品的稳定性和可用性。” Salvatore 表示。

    Mysql 之父、 MariaDB 创始人 Michael Widenius 已经连续三年参加云栖大会,年过 50 的他依然奋斗在代码第一线,Widenius 表示:“很多 MariaDB 的运用源自我们的开发者,维基百科用的就是 MariaDB,我们也从阿里巴巴中获得了很多开源的支持和贡献,确保能给大家提供功能丰富的数据库产品。”

    图为 Mysql 之父、 MariaDB 创始人 Michael Widenius
    图为 Mysql 之父、 MariaDB 创始人 Michael Widenius
    近年来,阿里巴巴在技术领域投入不断加强,拥抱开源也由来已久,积极加入了包括自由软件基金会、Apache 软件基金会和 Linux 基金会在内的多家国际知名开源组织。目前,阿里巴巴开源和维护的开源项目超过 150 个,涵盖中间件、开发框架、数据库和各种工具类软件。在开源中国公布的“2016 年度最受欢迎中国开源软件评选 TOP20”榜单中,阿里巴巴独占 4 席。其中 Weex、Ant Design、Dubbo、Fastjson 在 GitHub 上的星标数已经破万,“Alibaba”组织在 GitHub 上星标数超过 170,000,组织排名进入前十。

    开源之路

    行癫认为,“开源我觉得有几个层次”,刚开始可能只是做了一个工具,这个工具做得非常好,可以解决一个非常确定性的问题。逐渐地,这个工具可能会变成一个产品、变成一个系统,慢慢延伸出一堆工具。“开源要成功,第一步要做好一个工具,第二步会变成全链的产品,我觉得最成功的就是变成新的一个生态。” 开源软件组成了一个生态,无数人为这个生态贡献了新的智慧、新的工具。融入这个生态的人,或许只用非常少的代价,就能够找到跟他的工作场景、业务场景相匹配的模式。到这个程度,“这个社区就发展得比较成熟了。这个可能是大多数开源软件必须要去走的一些路径。”

    “今天要开源的其实不仅是软件,还有很多硬件”,行癫说。“今天的开源比以前的更复杂,有可能是端跟云端的结合。……互联网第一阶段的开源,是基于互联网的端建成的;互联网的第二个阶段是 IoT,我们希望所有的设备能够串起来。所以我认为接下去开源软件会与硬件结合,这就是从单纯的互联网向 IoT 时代发展非常重要的一个过程。”

    结语

    在近来几届云栖大会上,开源已经成为了永恒的主题,除了开源专场之外,在各个会场和论坛,充斥着各种热烈的开源气息,无数建筑于开源之上的产品、服务源源不断的开发出来,无数的技术人员和开源爱好者投身于开源世界。让我们期待云栖大会成为开源的大会,成为中国开源界和世界开源接轨的枢纽。

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>