摘 要:大数据时代来临之后,传媒作为信息产业也不可避免的收到了冲击。本文分析了大数据的四个特点,分别从传播效果、新闻价值、新闻业务、传媒数据库、媒体的功能和媒体从业人员探讨了大数据带来的冲击和影响。最后分析了大数据带来的负面影响:泄露隐私的危险。
关键词:大数据;传媒业;变革;隐私
世界著名咨询机构麦肯锡公司于 2011年5月发布了《大数据:下一个创新、竞争和生产力的前沿》报告,掀开了大数据研究的序幕。作为从经济和商业维度诠释大数据发展潜力的第一份专题研究成果,该报告系统阐述了大数据概念,详细列举了大数据的核心技术,深入分析了大数据在不同行业的应用,明确提出了政府和企业决策者应对大数据发展的策略。
一、大数据简介
麦肯锡认为,“大数据”是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集。该定义有两方面内涵:一是符合大数据标准的数据集大小是变化的,会随着时间推移、技术进步而增长;二是不同部门符合大数据标准的数据集大小会存在差别。目前,大数据的一般范围是从几个TB到数个PB。 IBM将大数据的特点总结为4个V: (一) Volume
数据体积巨大,在我们需要处理数据的时候,不再需要随机样本,而是全体数据。
(二)Variety
数据的类型及来源繁多并且包含越来越多的非结构化数据(如图像、声音等信息)。 (三)Velocity
数据增长速度快,其对于实时处理速度的要求也很高。 (四)Value
数据价值高但密度低,海量数据背后拥有价值的数据比例低。 二、大数据对传媒的影响 (一)对传统媒体的影响
传统的纸媒在互联网的冲击下依然摇摇欲坠,报纸、杂志的受众纷纷转投更先进、更具现代气息的互联网,或者手机、iPad等移动终端。更不用提现在这些新媒体有了大数据作为支撑。
亚马逊网站最初的时候,聘请了20多个书评家和编辑组成的团队,他们写书评、推荐新书,挑选非常有特色的新书标题放在亚马逊的网页上。这个团队创立了“亚马逊声音”这个版块,成为当时公司这顶皇冠上的一颗宝石,是其竞争优势的重要来源。后来林登创立了基于大数据分析的系统,应用在网站上之后,亚马逊可以根据客户个人以前的购物喜好,为其推荐具体的书籍,而且除了书籍,更可以推荐电子用品,烤面包机这些产品。这个系统创造了亚马逊销售额的三分之一。最终,书评组被解散了。很多大型书店和音乐唱片商店也歇业了。
现在的网络已经可以在新闻下方列出一长串的相关新闻的链接了,视频新闻也会在播放完毕之后自动弹出相似视频供挑选。而纸媒还完全做不到这一点,如果继续发展下去,任由新媒体在用户个性化方面做的更好,纸媒势必也面临着亚马逊书评组的命运。 (二)对传播效果的影响
大数据时代,新闻传播将更有针对性,更精准,传播将更有效果。大众传播是粗放型、广种薄收的传播,把所有的新闻信息向所有人传播,缺乏针对性、精确度。受众必须从众多
新闻信息中寻找自己需要的、感兴趣的内容。
新闻媒体自产生以来,都是以大众传播为主,综合性报纸、综合性的广播电台电视台都是传播界的王者。能做大做强的,都是面向大众的综合性媒体。大数据时代,情况将发生变化,人们上网浏览都会留下“足迹”——各种数字化记录,即浏览数据。对一位受众——固定 IP 地址或同一终端浏览器上的所有浏览数据或相当长时间的浏览数据进行分析,便可获知其上网习惯、喜好等等,根据这些数据,在最合适的时间以最恰当的方式向他推送最感兴趣的新闻,这就是精准传播、“长尾营销”,这样的新闻不仅不会被当做垃圾,还很可能被定制。随着大数据时代的发展,精准传播会越来越普及,越来越受欢迎。
(三)对新闻价值的影响
智能手机普及、社交媒体发达,使得人人都是记者,手机便是媒体,新闻报道、信息发布已经不再是媒体人的专利了。“我在现场”曾经是传媒业及其从业人员倍感骄傲的事情,时效性也成为业内比拼最为激烈的指标。大数据时代,联网的网民和各种电子记录设备(如摄像头)散布在社会各个角落,不断观察和上传实时情况,在经过网民们的“分布式”集体选择后,形成热点新闻。
更加具有颠覆性的是,应用了大数据分析的网站如果能够判断哪些新闻更加符合大众的口味,新闻价值将失去其意义,新闻编辑的新闻敏感性也将无用武之地。读者喜欢什么样的新闻,编辑所要做的就是按照大数据分析的结果去呈现那样的新闻,只要“知其然”,无需“知其所以然”。只需要关注新闻类型和读者的相关关系,无需花费多余的精力深究因果关系。除非是要进行学术研究。 (四)媒体数据库
大数据时代,媒体要有强烈的数据意识,要善于收集数据、分析数据、使用数据,挖掘数据的潜在用途。媒体业本身是信息产业,并且是信息业的前沿,在大数据时代拥有先天优势,每天都有难以计数的文字、图片、视频被创作出来,只不过这些信息没有被数据化。很多传统媒体纷纷触网,信息已经很大程度上完成了数字化——即转换成了可被电脑识别的二进制信号,但是大数据时代,这些信息需要数据化——即变成可量化制表分析的过程,这样,方能发挥大数据的核心威力:预测。 大量的数据也需要被妥善的利用,需要挖掘数据背后潜在的价值。消费者信贷领域的一些公司考虑开发以Facebook社交图谱为依据的信用评分,因为他们发现:个人会偿还债务的可能性和其朋友会偿还债务的可能性成正相关。“社交网络分析之父”贝尔纳多哈柏曼的分析显示,微博中单一主题出现的频率可以用来预测好莱坞的票房收入,从而预测一部电影的成败。可以说,数据的真实价值就像漂浮在海洋的冰山,第一眼只能看到冰山的一角,而绝大部分则隐藏在表面之下。 (五)对媒体功能的影响
媒体在做好社会记录者与信息传播者外,更应定位成社会解读者和分析预测者,深度解读和去伪存真本是媒体的重要职责,而大数据赋予的全面深刻的洞察恰好能为传媒再添一双慧眼。媒体数字化转型正在进行中,从采集、处理、储存、传播,完全地数字化后,媒体产生的数据量将急速增大,成为大数据的重要生成与应用行业。
大数据的核心思想是预测,是用数学算法来分析数据,预测事物发生的可能性。亚马逊则是依据类似的原理推荐书籍等产品。
大数据应用到新闻领域,必然利用其最核心的竞争力——预测,相比于数据新闻学,预测新闻学更有可能大行其道。数据新闻的精髓或许在于将传统的新闻敏感和使用数字信息讲述一则好故事的能力相结合而带来新的可能性, 这些可能性会出现在新闻报道的任何一个阶段。预测新闻是根据事物发展现阶段的影响要素和特点,对事物发展的规律和走向,进行判断和推测的一种报道。
(六)媒体从业人员需要新的技能
大数据时代,传媒业还要避己之弱,补足自身发展的短板。大数据时代要求人们具备三种能力:数学运算与建模的能力、网络工程与分析能力、能够洞见事物本质的能力。麦肯锡咨询公司报告预测,到 2018 年,仅美国将面临 14 万到 19 万高级数据分析师短缺的情形。中国的短缺情况应相去不远。但是,专业的工程师、数据挖掘师擅长数据处理技术,对国情、社会及社会问题、对政治经济的了解却并非长项。传媒从业者与人与社会打交道,以整个社会为思考对象,对人对事有特殊的洞察力,因此媒体需着力培养数据时代的媒体专家:让编辑记者尽快了解大数据,掌握基本的机器学习、各种算法及数据分析方法,懂得用大数据技术分析解剖社会问题,分析处理民众关注的社会热点、难点、焦点问题;让数据工程师熟悉社会、了解社会,认清国情,增强政治辨识能力,培养社会洞察力,拥有这样一批“全才”,传媒业才有更大的发展潜力。 三、负面影响:隐私
大数据带来的变革毋庸置疑,但是这一切都是建立在正确利用它的基础上。换个角度想一想,我们每天都暴露在“第三只眼”之下:淘宝、亚马逊监视着我们的购物习惯,谷歌、百度监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听了我们心目中的“TA”,还有我们的社交网络。一旦这些数据落入了不法之徒手中,后果不堪设想。当所有的信息都已经在数据库里面的时候,有意识的避免某些信息就是此地无银三百两。谷歌街景在采集道路和房屋的图像的数据的时候,遭到了很多人的反对,因为民众认为这些图片会帮助盗贼选择有利的目标。于是,谷歌将不同意的业主的房屋和花园的照片模糊化的时候,起到了反作用,对盗贼来说,反而暴露了目标。
而且,在大数据时代,匿名化也是不可行的。在新闻报道的时候,可以用化名取代真实的人物,但是,其他的数据,时间、地点、事件的细节必须保持真实。只要有足够的数据,很容易将范围缩小到唯一的目标身上。匿名化与大数据同时存在几乎成了一个悖论。 大数据并不是一个充斥着算法和机器的冰冷的世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助时暂时的,更好的方法和答案还在不远的未来。
因篇幅问题不能全部显示,请点此查看更多更全内容