大数据与传媒业发展

互联网带来了继文字发明、古登堡印刷术、电报之后的第四次传播革命,也带来了继蒸汽机的发明和电力的广泛应用之后的第三次工业革命  
互联网带来了继文字发明、古登堡印刷术、电报之后的第四次传播革命,也带来了继蒸汽机的发明和电力的广泛应用之后的第三次工业革命

郭全中

发表于《新闻与写作》2014年第6期

互联网带来了继文字发明、古登堡印刷术、电报之后的第四次传播革命,也带来了继蒸汽机的发明和电力的广泛应用之后的第三次工业革命,已经成为整个社会的底层架构和标配。大数据作为互联网的一个重要方面,必将对传媒业带来革命性变化,这就要求传媒业从业人员具备大数据思维,充分利用大数据技术来帮助自身实现跨越式发展。

一、信息的开放与云计算带来了大数据

首先,传播革命使得信息数量呈指数级增加。在文字发明之前,人类的传播只能通过口口相传,信息量极其有限,公元前4000年楔形文字出现之后,使得传播可以突破时间限制而实现代际传播,通过把信息记录在龟甲、树叶、泥土等介质上,信息的数量开始大幅度增加。但是由于技术的制约,信息只能通过抄书人来进行记录和传播,导致信息的数量和传播范围都受到很大的制约。1450年,古登堡印刷术的发明使得传播突破了范围限制,传播开始从精英们的“权力”转变为普罗大众的“权利”,此后的50年间,大约有800万本书被印刷,比之前所有的手抄本还多。此后的电报技术的发明,使得传播突破地区和时间限制,信息的数量也快速增加。而1989年,当万维网出现之后,实现了即时、便捷、海量和互动的传播,人人在接受信息的同时都可能成为自媒体,信息数量极速增加。根据ZDNET的数据显示,2013年中国产生的数据总量超过0.8ZB,2倍于2012年,相当于2009年全球的数据总量。

其次,摩尔定律使得大数据成为可能。摩尔定律以英特尔创始人之一的戈登·摩尔命名,该定律认为,同一个面积集成电路上可容纳的晶体管数量,一到两年将增加一倍。即计算机硬件的处理速度和存储能力一到两年将提升一倍。从1965年摩尔定律提出以来,硬件技术的发展基本符合摩尔定律,尤其是当存储器的性能提高的同时,硬盘价格以更快的速度下降,即大约每9个月存储容量的价格就下降一半,1955年每兆字节存储量需要6000多美元,而到2010年,这个价格下降到不足1美分。硬件性能的快速增加和单位存储成本的大幅度下降,一方面使得数据处理速度更快、更方便,云计算技术被开发出来;另一方面,数据处理更为便宜,使得海量的数据积累成为可能,这两方面原因使得大数据具有了可能性。

第三,政府数据公开助推大数据发展。数据分为政府数据和企业数据,并且政府数据在数据中居于关键性地位,大数据要真正发挥作用,政府的信息必须公开。美国等西方发达国家大力推进数据开放运动,并于2011年9月20日,美国等8个国家在纽约发起“开放政府联盟”,以向本国社会开放更多的信息。目前,该联盟已经有50多个会员,30多个国家建立了公共数据的开放网站。2012 年3 月,奥巴马政府公布“大数据研发计划”,以提高和改进人们从海量、复杂的数据中获取知识的能力,发展收集、储存、保留、管理、分析和共享海量数据所需要的核心技术,大数据成为全世界关注的焦点。

因此,可以看出,互联网技术的发展与政府信息的公开是大数据发展的前提,而云计算则是大数据的基础。

二、大数据面面观

首先,何为大数据。大数据是指服务于决策,需要新型数据处理模式才能对其内容进行采集、存储、管理和分析的海量、高增长率和多样化的信息资产。大数据绝不仅仅是指规模大,其定义包括如下四层含义:一是大数据的目的是服务于决策,能够提升决策能力;二是现有的处理模式不能有效处理大数据;三是大数据是一种信息资产,而不仅仅是一堆数据和成本,所谓信息资产是指其能够为政府和企业带来未来经济利益的信息资源;四是大数据比海量数据更为复杂,海量数据包括结构化和半结构化的交易数据,而大数据除此以外还包括非结构化数据和交互数据。

其次,大数据具有在线性、海量性、全体性、非结构化、实时性等特点。一是在线性,即大数据是永远在线的,能够随时被调用的;二是海量性,即大数据规模巨大,当前通常指10TB规模以上的数据量;三是全体性,即大数据采取的是全体思维,而不是样本思维;四是非结构化,即大数据的种类繁多,不仅包括传统的关系数据,而且包括以网页、视频、音频、e-mail、文档等形式存在的未加工的、半结构化的和非结构化的数据;五是实时性,即大数据能够实时反应。例如,在Google搜索框输入一个关键词,能够瞬间呈现。

第三,大数据代表着新的思想和思维。大数据既能处理“因果关系”又能处理“相关关系”,即不仅能够回答“为什么”又能回答“是什么”。在小数据时代,只能通过抽样调查的方式来回答“为什么”,而大数据则能通过全样本的方式来回答“是什么”,即发现相关关系,这能够帮助我们更好地认识和了解世界。

第四,大数据的关键在于智能化,即能利用有效的工具对数据进行有效的挖掘和专业化处理,进而通过“加工”实现数据的“增值”,进而实现盈利。目前,所用的方法主要有数据挖掘和对比分析,主流的相关技术主要有MapReduce(一种编程模型)和Hadoop(一个分布式系统基础架构)为代表的非关系数据分析技术。

第五,大数据分析相对于传统办法具有显著的优势。一是大数据能够实现分析的高度智能化,即一方面实现信息收集和分析的智能化,另一方面实现数据与用户需求的有效匹配;二是大数据分析改变之前的市场调研和数据分析相对滞后的模式和方式,能够及时、迅速地进行分析;三是由于可以大量使用技术手段,其成本相对较低。

第六,大数据的实施依赖于数据的可获得度、模型是否科学和观点的提炼。其一,在数据的可获得度方面,目前在国内,大数据的发展受制于一些政府信息的公开性不够,很多数据难以获得,导致难以实现真正的大数据挖掘和分析;其二,在模型建构方面,模型的科学性直接决定着数据分析的质量,这就要求有高超的建模水平;其三,在观点提炼方面,为决策提供依据的基于数据挖掘的独到、高质量的观点,高度依赖于高质量的数据解释,这就体现了行业专家的价值。

第七,大数据与云计算有机深度融合。由于大数据需要处理大量的非结构化数据,为云计算大规模和分布式的计算能力提供了广阔的应用空间,云计算已经实现了数据分析即服务,二者相伴而生。此外,当未来基于数据的语义网取代基于网页的互联网时,大数据必将成为我们获取信息的主流。

三、大数据给传统媒体业带来的机遇与挑战

1.大数据带来巨大机遇

首先,大数据颠覆传媒业。当前,我们已经进入大数据时代,主要标志就是已经从内容稀缺时代转变为信息过载时代,这对传媒业带来了革命性影响。一是信息量指数式增长。相关研究表明,从2007年到2013年,人类存储的数据量从300艾字节快速增加到1.2泽字节,增长了数倍,而其中非数字数据只占不到2%。二是信息内容更加丰富。除了传统媒体生产的原创内容之外,一方面由于博客、微博、微信等很多自媒体平台的出现,大量的、高质量的自媒体内容层出不穷;另一方面由于互联网的海量空间使得以往不可能获得版面的生活服务类信息可以传递给用户,而且对于广大用户来讲,这些资讯比新闻的用户黏度更高。因此,新闻和内容的稀缺性进一步被稀释,其价值也必然被降低,也越来越难以收费。三是基于大数据的互联网媒体正在快速颠覆传媒业旧格局。一方面,在广告市场方面。根据国家工商总局的数据,2013年,所有媒体的发布费用为2144.13亿元,其中电视为1101.10亿元,同比下滑2.75%;报社为504.70亿元,同比下滑9.17%。可以看出,我国互联网广告已经成为仅次于广电的第二大广告市场,而2014年会超过广电,成为我国第一大广告行业。并且由于互联网依然保持着40%左右的增长速度,而传统媒体却呈现下滑趋势,可以预测在未来5年内,互联网广告会占据绝大多数媒体发布费用。另一方面,互联网媒体正在大量分流传统媒体的用户和人才。

  其次,基于大数据的产业融合加速进展。以大数据为代表的互联网技术打破了既有产业之间的界线,把之前界线分明的产业融合在一起,形成新的产业蓝海。传媒业也在互联网技术的推动下,不断和其他产业融合成新的产业。一是传媒业与通信业以及IT业融合成新的信息服务业。未来新的信息服务业潜力巨大,根据国务院正式发布的《关于促进信息消费扩大内需的若干意见》:到2015年,信息消费规模将超过3.2万亿元,年均增长20%以上;带动相关行业新增产出超过1.2万亿元。其中基于互联网的新型信息消费规模达到2.4万亿元,年均增长30%以上;基于电子商务、云计算等信息平台的消费快速增长,电子商务交易额超过18万亿元,网络零售交易额突破3万亿元。从中可以看出,大数据必然是信息服务业的基础。二是传统零售业和IT业融合成电子商务业。三是传统金融业和IT业融合成互联网金融业。

第三,基于大数据的互联网生态系统快速形成。随着传媒业竞争程度日益的加剧,传媒业竞争的关键也从以前的“内容”、“产品”、“平台”上升为“商业生态系统”。一是未来商业生态系统将是竞争的主体,阿里巴巴的生态系统由信用体系、金融体系、社会化大物流体系、小企业工作平台和大数据系统所组成。需要着重说明的是,在生态系统竞争层面,未来传媒平台仅仅是生态系统的一个标配,虽然起着关键作用,但是已经不是收入的主体。而且内容、产品、平台到生态系统是一个逐级向上发展的关系,后者包括前者又是前者的升级版和高级版,后者又在不断地颠覆或替代前者。二是生态系统时代运作的关键点是“商业生态系统”,其优势在于自组织、自强化和涌现等。例如,在自强化方面,由于阿里巴巴能够精准地掌握商户的商业信息,其在为商户提供贷款时,就具有很强的风控能力,而风控能力是金融业最为关键的能力,因此,阿里巴巴就能够更好地为在其平台上运作的商户提供金融服务。

2.大数据为传统媒体业带来重大挑战

首先,出现了信息的过度充裕和满足于用户个性化、定制化需求的信息的极度匮乏之间的突出矛盾,每个人都像生活在信息的汪洋大海中,但又找不到有效信息的信息乞丐一样。传统媒体在各种新的传播媒介和方式上不断探索,通过手机报、网络媒体和客户端、官方微博等方式,积极进入各种渠道和终端,但是一直不能解决至关重要的盈利模式问题,而根本问题是缺乏基于大数据的技术平台,其提供的内容难以有效匹配给用户。

其次,传统媒体的大数据能力弱。一是我国的大部分传统媒体还依然是小、散、弱的现状,导致很难形成大型的高质量的信息平台。二是由于同质化等原因,导致信息大量重复,也给信息的筛选和提炼带来了很多困难。三是大数据分析高度依赖于用户规模和技术,而这些都是传统媒体的短板,当前最大的数据分析公司是谷歌、Facebook、阿里巴巴以及腾讯等具有高科技技术的互联网公司。

四、传统媒体大数据转型的实践与误区

1.传统媒体的大数据实践

首先,通过大数据分析及时抓取传统媒体用户的相关阅读等信息,提高用户体验。当前,无论是平媒还是广电媒体,相较于互联网媒体,用户体验都是其短板,而大数据分析可以通过分析用户的关注点、需求等数据,来更好地满足用户的需求,进而提升其用户体验。例如,金融时报开通免费专区供注册的读者阅读,金融时报获得了大量的读者信息,通过大数据分析读者的需求,为其提供个性化的信息,就能实现用户的付费阅读,目前,金融时报的订阅收入已占全部收入的一半以上。

其次,积极进行新闻数据化尝试。当前,用户对可视化的数据更为感兴趣和关注,这就要求传统媒体更好地实现数据可视化,传统媒体的一些重要报道越来越重视信息的可视化。

第三,利用大数据技术开发舆情管理的相关产品。当前,我国正处于社会转型期,各种矛盾突显,舆情也处于多发期,因此,在这种时代大背景下,舆情管理的需求量很大,传统媒体因为具有较强的新闻挖掘能力和传播能力,可以利用大数据分析手段发力舆情管理业务。

2.传统媒体的大数据实践误区重重

首先,依然秉持“内容为王”理念。大数据时代,单纯的内容已经难以形成商业闭环,只有利用大数据技术实现信息与用户个性化、定制化的需求才能实现商业闭环,也才能实现商业价值,这就要求从“内容为王”理念转变为“信息服务为王”。但是从传统媒体的实践来看,主流观念依然是“内容为王”,导致对互联网理念和技术不够重视,大数据平台更是难以实现。

其次,误把数字化当成数据化。当前,很多传统媒体在进行大数据转型时,对数据化的认识较为肤浅,认为只要把传统内容转换成数字化内容就实现了数据化,在实践中就是仅仅通过电子版、互联网网站实现内容的在线化呈现。大数据的本质是建立起不同数据之间的内在联系和建立起用户和信息之间的联系,通过数据挖掘和分析,找出不同事物之间的相关关系,进而实现商业价值。由于传统媒体当前做的仅仅是数字化,其实践仅仅完成了素材建设部分,距离真正的数据化还有很远的距离。

第三,误把新闻可视化当成数据化。当前,很多传统媒体在做新闻时,经常借助可视化工具,使得新闻更为直观、更生动、更可读,取得了不错的效果,但是大多数可视化新闻仅仅追求新闻的美观,而并没有充分体现数据之间的本质逻辑关系,既不能有效地促进用户思考,更不能有效呈现其目的。

五、大数据与传媒业的有机融合:信息智能匹配

在大数据技术的推动下,我们已经进入信息智能时代,这就要求传媒业和大数据进行有机融合,实现信息智能匹配。

首先,打造信息智能匹配平台。要真正满足用户个性化、定制化的信息需求,就必须通过数据挖掘和分析技术,在不断优化用户信息需求的基础上,实现信息和用户需求的智能化匹配。这就要求做好如下工作:一是打造巨型的云信息服务平台,在该平台上,云集着各式各样的信息,既有文字的,又有音频和视频的,并能实现信息的分类筛选、摘编和深度加工;二是打造大型的大数据平台,在该平台上能够通过数据挖掘和分析等方式,实现对读者和受众个性化需求的准确定位和把握;三是能够通过技术手段低成本地实现信息和受众个性化、定制化的需求之间实现智能化匹配,并能通过各种支付手段,实现智能化信息的收费。例如,亚马逊通过自己研发的被业界称之为“鬼打墙式的推荐”的精准推荐系统每秒卖出的商品达72.9件,这种精准推荐系统就是跟踪客户的所有消费习惯,不断进行优化。Google和百度利用搜索和筛选手段在一定程度上实现了读者的主动信息需求,而亚马逊等利用推荐手段也在一定程度上满足了读者的被动信息需求,而基于巨型平台的社会引擎将能够实现精准信息和读者需求的智能匹配。

其次,信息智能匹配能够实现信息收费。一是信息智能匹配包括了内容和信息、数据分析和挖掘平台以及用户,形成了完备的信息服务商业闭环,信息收费的条件已经具备。二是能够为用户节省大量的信息搜索时间。在信息过载时代,每个用户每天即使花费3个小时的时间也难以搜寻到基本满足自己需求的高质量信息,而信息智能匹配则能给用户提供个性化、定制化的信息,使得用户仅仅需要0.5—1小时的时间就能掌握大部分重要信息,这样每天就能为每个用户最少节省两个小时的时间。按照当前的平均工资水平,2个小时的时间成本为50元左右,则一个月就为1500元左右,如果有4亿用户愿意每月向信息智能服务付费100元,则一年信息智能服务业的规模就为4800亿元。因此,只有实现了信息智能匹配,内容收费的良好愿望才能实现,而这必须以大数据为基础。

第三,信息智能匹配平台同时提供多种服务。在基于大数据平台的平台上,除了信息智能匹配服务之外,还同时提供精准广告服务、电子商务服务、舆情服务等。在精准广告服务方面,数据分析和挖掘平台可以在精准掌握每个用户消费偏好的基础上,实现广告主的营销信息和用户需求的智能匹配,达到更好的广告效果,真正达到精准营销的目的,百度正在通过自己的大数据计划强化自身的领先优势。在电子商务方面,可以通过对生活服务类信息需求的分析,找出用户对商品的有效需求,引导用户直接下单,阿里巴巴居于绝对领先地位,根据其上市招股说明书数据,2013年其旗下公司的交易额总计2400亿美元,比亚马逊和EBAY交易额的总和还要多。在舆情服务方面,政府可以利用大数据平台及时发现民众诉求并及时回应,以提升政府的治理能力。

第四,大数据能够更好地实现“OTO”。“OTO”作为线上资源和线下资源的有机结合和互动,是传媒业运作的核心模式。传统的“OTO”模式能够实现线上资源向线下资源的传导,但是却难以实现线下资源向线上资源的传导,虽然二者有结合但难以及时互动;而基于大数据的现代的“OTO”模式则能够完全实现线上资源和线下资源的有机互动,能够更好地发挥该模式的威力。

第五,打通产业之间的界线,实现跨界融合发展。大数据用户平台提供了多个产业协同发展的基础,用户数据能够为多个产业、多个企业共同使用,这就极大地助力跨界发展,例如,阿里巴巴在大数据用户平台的推动下,横跨电子商务业、传媒业、物流业、金融业等多个行业。

当然我们也必须清醒地认识到,虽然大数据是传媒业融合的利器,但是由于一些传统媒体缺乏技术能力和多秉持“内容为王”的理念,这也导致其向大数据的转型困难重重。

您可能还喜欢…

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>