
063
大数据指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业采取更积极的经营决策的数据资讯。我们在上网时会经常浏览网络新闻和观看视频、收发电子邮件、在电商网站下单购物、通过社交工具与朋友互动聊天,甚至用手机自拍照片上传到微博或微信……无论通过哪种网络终端、采用哪种网络访问方式,人们在网络世界里留下的每一个“足迹”,都会在不知不觉之中以“数据”的形式被“忠实”地记录下来,这些以几何数量级增长的数据正在逐步重构着网络世界,同时也重构着我们的新闻传播。2013年6月25日,中国社会科学院新闻与传播研究所和社会科学文献出版社在北京联合发布了新媒体蓝皮书《中国新媒体发展报告(2013)》。中国社会科学院新闻与出版研究所副所长唐绪军在发布会上表示,今年新媒体发展将加速重塑其他产业的格局,大数据将带动各个产业调整结构。根据发布会上公布的信息,我国当前已拥有5.78亿互联网用户和超过11亿手机用户,全球新媒体用户第一大国的地位得到进一步的巩固和加强。在新媒体应用领域,我
国超过两亿用户的新媒体应用就有十几项之多,以大数据等为代表的新兴业态不断呈现,腾讯、阿里巴巴等企业已经成为走向世界的中国新媒体应用民族品牌。在整个社会都热衷的大数据发展热潮之下,传媒业和传媒人确实应该认真关注它的由来、关注它的发展。但从科学技术发展史来看,任何一种新技术都不可能是包治百病的灵丹妙药,期望越高可能失望越大,大数据也不能例外,科学的态度应该是在大数据的众声喧哗中进行冷静分析,在积极发挥大数据正面作用的同时,也要尽力避免大数据由于自身属性所决定的不可避免的局限性,做到扬长避短。
1. 数据没有长期积累,且彼此之间关联度低
西南大学新闻传媒学院院长董小玉认为:“大数据的优点是显而易见的,有了互联网上的海量信息,传媒就获得了取之不尽的信息、知识和数据,无论是古今中外,还是各行各业,统统包含。在新闻创作过程中,很多数据可以成为重要的背景资料和链接,有利于与其他新闻事实形成比较和参考。”但对于传媒企业来说,实施大数据战略除了要保证数据真实性之外,还需要以大
大数据对新闻内容生产的局限
/ 左艳红
大数据的核心就是数据的文化、思维和方法,大数据的应用只是信息技术应用的一种,大可不必将大数据过于神化。美国是大数据应用的先行者,该国运用数据来研究社会问题和国际问题已有80余年的历史,但是盖洛普调查所预测的美国大选结果,虽然每次预测基本上都要搜集和分析十多万个数据,但也出现了多次预测结果错误的情况。全球最具权威的IT研究与顾问咨询公司Gartner甚至认为,在我国方兴未艾的大数据现在已到了幻灭期,宣称要把大数据赶下“神坛”。鉴于此,我们在将大数据技术应用到传媒行业时,应该保持清醒的、客观的头脑,要深刻反思大数据技术的两面性并予以警醒,因为大数据存在着对个人隐私的侵犯、虚假数据泛滥等制约着它在传播业应用的诸多问题。
大数据 新闻内容 程式化 局限
左艳红,西安外国语大学英文学院副教授,硕士。
DOI:10.13786/j.cnki.cn14-1066/g2.2014.08.020
2. 新闻采集程式化
通过大数据分析可以改变传统的媒体业务流程和形态,传统媒体和媒体人也将随之被大数据所,这种的效果从业者只有深刻领会并运用,才能真正迎风而行,开辟传播新领域。[1]董小玉认为:奔涌而至的海量信息,容易让记者丧失思考的能力和思想深度,形成思想方面的短板,导致语言的程式化。因为无论传播技术多么先进,归根到底有价值的独家新闻和深度报道均离不开新闻现场,信息技术的先进只能保证新闻工作效率的提升,但最鲜活、最生动、最震撼的新闻内容始终离不开“现场制造”。想做好新闻报道,从业者一定要强化现场意识,并且无论何时这一点都是无法改变的定律。鲜活的新闻内容来源于生活,一旦从业者过分沉迷于大数据的深坑,就难以展示自己个性化语言和独特的风格,现在有些新闻从业人员,迷信大数据技术的“威力”,缺乏辨识能力,在思想和行动上有一定程度的惰性,为了新闻报道到处搜集相关的信息,且不对收集的信息加以辨别和求证,直接加以引用,停留在现象外表就事论事,或者鹦鹉学舌、人云亦云,这是种十分不敬业的从业态度。[2]
3. 大数据可能导致误解
过度神化大数据对传媒业的促进作用,对我们冷静地思考未来传媒业的发展态势不仅无益甚至可能有害。一个可供参考的例子是原风行一时的CRM系统(客户管理系统),在CRM刚刚兴起之时,整个商业界为之欢呼并寄予厚望,似乎它能够整个商业传统,然后时至今日CRM已经开始和“灾难”“失控”等负面词语联系在一起。作为前车之鉴,传媒业在大数据问题上应避免重蹈覆辙,《大数据时代:生活、工作与思维的大变革》一书的作者肯尼思·内尔·丘基尔及维克托·梅耶—舍恩伯格在其《大数据的兴起》一文中,对我们的提醒应该引起我们的高度关注,他们在书中指出大数据只是一种资源和工具,它的目的是告知而不是解释;它意在促进理解,但可能导致误解。并且他们认为,人们必须用一种不仅欣赏其力量、而且承认其局限的态度来接纳大数据。纳西姆·尼古拉斯·塔勒布在其著作《黑天鹅:如何应对不可知的未来》描述道,我们的已知世界是白天鹅,我们的未知世界则是黑天鹅。我们平时观测到的数据都是有关白天鹅的,由此得出的天鹅作息规律也是关于白天鹅的,直到黑天鹅飞过来使我们以往的努力都化作泡影。其意在于尽管我们掌握的数据越来越全面,但在对未知事物的预测当中,这些数据可能完全没有实际意义,在真正解决问题时很可能将人引入歧途。
4. 大数据应用难度较大
传媒从业者以整个社会为报道对象,将整个社会纳入自己的思考范围,剖析社会问题,分析民众关注的热点、难点和焦点问题,这种传媒业的职责要求决定了媒体从业者需要具备特殊的洞察力,而这种洞察力需要编辑记者了解数据分析和数据处理的基本方法,同时要求数据工程师具有一定的新闻从业素质,媒体只有拥有这样一批“全才”,传媒业才有更大的发展潜力。[3]但目前传统媒体从业人员多是沿用“内容为王”的思维,忽略了适应“技术基因”的技术思维,因此普遍欠缺运用大数据的能力,这也从根本上影响了大数据在传统媒体中“扎根”。近年来,以电子形式存储的新闻数据以几何级数增长,其数量之庞大已经达到无法精确计算只能进行大略估算的程度。据统计,人类现在一年生产的数据量是上年的1.5倍,如何从海量的数据中提取对传媒业有价值的信息显得尤为关键。这考验了我们运用大数据的能力,否则大量的数据可能反过来成为信息“垃圾”,“污染”了新闻传播产业链。当前大数据建设欠
064 2014.8 传 媒缺专门的数据分析方法,很多媒体也没有设立专门的数据管理部门并拥有专业的数据分析人才,无论是数据资源获取能力还是对数据的处理分析能力,传媒行业目前还没有完全具备应用大数据的真正能力,甚至在未来可以预见的一段时间内,从对数据分析的角度来看,国内传媒行业同样人才匮乏。麦肯锡全球学会曾发布的一份报告显示,美国需要14万~19万名具有“深度分析”经验的工作者以及150万名更加精通数据的经理人。美国尚且如此,作为大数据应用的后起国家,再加上之前一直严重的轻技术重内容思维,传媒行业大数据人才的现状不容乐观。
5. 无法判断新闻价值
新闻价值是指那些客观存在的、事实本身包含的能够引起公众共同兴趣的要素,但在实践层面上新闻价值本身往往被涂抹上浓重的主观色彩,因为事实中所包含的新闻要素不可避免地要经过记者的“过滤”。而判断什么样的事实、信息具有新闻价值及其价值量的大小多是由记者的视野决定的。由此可见,在新闻传播过程中新闻报道的选题内容、信息容量和表现形式等等在很大程度上取决于记者的新闻价值判断能力,这也是记者的价值所在。记者的职责正是发现新闻、加工新闻和传播新闻,记者的专业性也主要体现在判断的依据不是凭直觉,记者对事实之外各种利益关系的权衡是依据客观,这些特殊素质是蕴涵在事实信息里的。在极端技术派的眼里,大数据就像“雷神之锤”,所有与数据有关的问题都像是分布好的钉子,新闻生产如同板上钉钉这样简单和轻松,但实际上这种过于理想化的想法忽略了新闻生产中除了数据需求之外,记者的智慧和价格判断在新闻生产中的重要作用。尽管大数据可以轻松自如地处理大量非结构化数据,弥补从业者过于依赖直觉所带来的不足,但是我们也应当意识到大数据有很多不擅长的地方,大数据无法对情感和社会关系等进行定性分析,原始数据和分析结果会受到人类主观意识影响等。[4]正如马克·吐温颇具嘲讽意味的妙语:“引领我们进入困局的并不是我们不知道的事物,而是我们知道但不那么真实的事物。”内特·希尔在其著作《信号与噪音》中言之凿凿地声称,目前占据上风的是“不那么真实的”知识。
6. 侵犯个人隐私
隐私是公民一项最基本也是最神圣的权利,但在大数据时代,这一权利慢慢地被消磨掉甚至已经丢失了。我们不得不面对这样的一个事实:无论是大众还是个人都可以通过一系列的做法跟踪我们的行迹、习惯和选择,无论在何时何地,电脑、手机等各种网络入口以及无处不在的传感器等都会对个人数据进行采集、存储、使用、分享,而这一切大部分都是在用户无法控制和知晓的情况下发生的。[5]美国《外交》杂志网站在2013年5月9日刊登了微软研究院首席研究员、麻省理工学院客座教授凯特·克劳福德的一篇文章《再思考大数据》,他提醒人们,那种认为“大数据是匿名的,它不会侵犯我们的隐私”的想法大错特错。他举例说:“高度个人化的大数据集将成为网络黑客或泄密者觊觎的主要目标。世界上最富有的1%人群的个人信息和普通人的信息一样,非常容易被人公开。”美国有代号为“棱镜”的秘密项目,在过去6年时间里,通过进入微软、谷歌、苹果、雅虎等9大网络巨头的服务器,监控美国公民的电子邮件、聊天记录、视频及照片等秘密资料,提取其中的音频、视频、聊天、照片、邮件、文档以及联系方式等信息,以便分析人员追踪个人动态及其整个联系圈子。有资料显示,美国设在犹他州的“棱镜”服务器的容量足以储存未来100年整个人类的电子信息。在大数据时代,公众被置于各种各样的偷窥用户信息的“棱镜”之下,完全成了一个“透明人”。我们在“享用”各种现代通信工具提供的便利之时,其实也被各种收集网上信息的利益集团和个人剥光了衣服,在各种现代信息工具上裸奔。互联网哲学家叶夫根尼·莫罗佐夫对许多大数据应用程序背后的意识形态提出尖锐批评,警告即将发生“数据”。他提出,那些大数据应用程序应当接受审计人定期审查,以防权力滥用。
参考文献:
[1] 彭兰.“大数据”时代:新闻业面临的新震荡[J]. 编辑之友,2013(1):6.
[2] 陈昌凤.“大数据”时代如何做新闻[J]. 新闻与写作,2013(1):90.
[3] 李希光,张小娅. 大数据时代的新闻学[J]. 新闻传播,2013(1):7.
[4] 王斌. 大数据与新闻理念创新——以全球首届“数据新闻奖”为例[J]. 编辑之友,2013(6):16.
[5] 刘建明. 新闻媒体对“大数据”的驾驭[J]. 新闻战线,2013(6):72.
2014.8传 媒065
