我们生活在一个一切事物都可以被量化的“大数据时代★★★”,对数据的汇集与分析变得尤为重要◆■■◆。如今,大数据在IT、金融领域都已经出现了深入的应用,可视化★◆◆”数据新闻■◆★◆■”的兴起则是电视新闻媒体对大数据时代的积极回应。它为我们传播、接受信息提供了新的视角◆◆◆◆◆,形成了一种创新性的新闻表达方式和新闻报道形态。
大数据之“大”在于它的海量■★,即在互联网时代产生的数据信息的一个海量的汇集。业界将大数据的特点归纳为4个“V★★★”★★■:Volume(大量)、Velocity(高速)■◆★■、Variety(多样)、Veracity(精确)。这4个“V■★”足以在短时间内涌现出大量的数据。一组名为“互联网上的一天◆◆★★◆”的数据显示★■◆■★:一天之中■■,互联网产生的全部内容可以刻满1.68亿张DVD■◆★■;发出的邮件有2940亿封之多,相当于美国两年的纸质信件数量■◆★◆;发出的社区帖子达200万个★◆◆★◆,相当于《时代》杂志770年的文字总量★◆。 在如此浩瀚的信息海洋中★★★,数据变得大而散,人们无法及时获取有用的信息,需要专业的人员去筛选、汇集并及时的发布。因此★◆◆★■■,数据新闻应运而生■■■。
逻辑关系可视化的主要方法是根据各主体之间的关系,如由多到少、由早到晚、由慢到快等★★◆◆■■,构建一定的场景,连接各个事物,从而体现逻辑关系。在《数字十年》系列中的《中国网民数世界第一》这则报道中,为了表现近十年来我国的互联网普及率一直是上升趋势,该视频便设计成由低到高的台阶形状★◆◆★■■,台阶的高度与联网的普及率成正比,在节目中,随着时间轴的不断推进,台阶的高度不断递增,依次出现2008年和2012年两个比较有代表性的互联网普及数◆◆◆■★■,随后再用柱状图作为呈现方式,与全世界的互联网普及率相对比。无独有偶◆◆■★■,同样是在《数字十年》系列中,有个新闻专题是《网络购物十年增长600倍》■★◆◆◆■,在讲到★◆◆◆■“网店可以将营销成本降低55%★■”时■★◆,出现两个柱状图,第一个柱状图代表着实体店的营销成本,而第二个柱状图代表网店的成本。第二个柱子由与第一个柱子持平慢慢变到第一个柱子一半高◆★,体现成本急剧减少的逻辑关系。在表现以时间或者逻辑关系演变为主线的新闻上,动态的数据可视化比静态图表更有表现力,这也是电视媒体“可视化■◆■◆■”数据新闻的优势所在■■。此外,动态的可视化还可以对灾难性新闻进行动画模拟还原。例如2008年汶川地震后,央视在对堰塞湖的排险和处理过程进行报道时■◆■■,用动画的形式对抢险现场和抢险方案进行演示,十分直观可感。
2010年8月,在首届“国际数据新闻◆◆■■”会议上★■◆,米尔科·劳伦兹提出:“数据新闻是一种工作流程◆■,包括下述基本步骤★★■■■:通过反复抓取■◆■★、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事■★。★■★■◆◆” 对此定义■■■◆★,李希光教授则认为,数据新闻学或称数据驱动的新闻学,是计算传播学的一个具体应用,通过挖掘和展示数据背后的关联与模式,和丰富的、具有互动性的可视化展现,数据新闻学成为新闻学的新疆域和应用范例◆■★■,并作为一门新的新闻分支进入主流媒体。 目前,对于可视化“数据新闻◆★”业界众说纷纭■◆■◆■,尚未有一个统一★◆★◆、权威的概念。笔者认为,若要定义可视化■★■■◆“数据新闻”,首先要明确大数据★◆、数据新闻以及数据可视化三者的概念★★★◆。
在生态系统中,生物食物链连接有机生物之间的关系◆★◆,维持生态平衡。而在大数据时代◆■,新闻的生产方式基于数据食物链。数据食物链,指的是大数据新闻在生产过程中★◆■★■◆,对各种类别和各种来源的数据采集和聚合的过程。(见图5)
综合以上几点,笔者认为:所谓的可视化“数据新闻■★◆★■”,是以大数据为核心★★■★,利用软件工具,对海量数据进行筛选■★■、分析,用可视化技术进行数据的二次加工,最终形成将事件图形化的呈现给公众,帮助公众理解数据背后的相关联系,形成一种新的电视新闻报道形态。
在各个源数据以及各类信息采集平台聚集数据的过程中,形成了开放数据及资源共享,把记者的范围扩充为整个公民群体,推动新闻生产的外部化,使“众包新闻”成为可能,如此◆■★★■,新闻生产也变成一个由单向到多向的循环过程。
可视化的目的是突出要点,便于受众理解、记忆◆■◆★。所以在实现数据新闻的可视化之前要进行过滤★◆◆◆■◆,经过数据的过滤后,筛选出最有价值的信息,这类信息即为一则数据新闻所报道的核心。例如,2012年★★“两会★◆■★◆★”期间,名为“2012政府工作报告脱水版”的信息图表,将两万字左右“政府工作报告”中的要点浓缩成了几百字■◆◆★◆,便于可视化的处理,使得表述更加直观。实现所报道事物的“可视化”最常用的方法是仿影图形法。顾名思义★◆★,是仿照投影的造型所创意的图形,并经过省略、归纳■★★◆,呈现出条理化和几何化的造型轮廓。
分析图片我们可以得知■★★◆,从获取数据、对数据进行过滤、实现数据的可视化,到最后呈现出一则“可视化★★”的数据新闻,是一个信息不断增值的过程。要使信息的价值达到最大化,数据的“可视化”表达是一则数据新闻的核心。
以央视2014年的“据说两会”为例■■◆■,央视创造了一个全新的可视化Logo—★★“数据哥”(SIR DATA)★◆■◆■★,这是CCTV电视新闻史上第一次出现基于大数据而生成的可视化人形图像★★■■。数据哥以该节目的主持人顾国宁的照片为剪影,形成一个人形★◆◆■★。填充人形的是一个个关键词,而这些具象的关键词正是抽象数据的体现。每天央视的编辑人员通过十大关键词的搜索排行,用制图软件来按照关键词的重要性和搜索量两个维度来进行主次的排列,自行生成“数据哥”形象★◆◆★。受众可以根据判断词的大小、位置、颜色深浅就可以得知大家所关注的事件。中国人民大学舆情所多媒体舆情监测显示, 97%的网民认为◆◆■■“数据哥◆■★★★■”的形象准确表达了民众对“两会★◆◆★■◆”的真正诉求。这种由“数”到★◆◆◆“物◆◆”的直观呈现体现了◆★◆■★◆“民有所呼 会有所应”。
仿影图形法的基础是掌握一个事物的形态特征以及结构组织◆★■,在此基础之上进行一个描摹,它具有极简化的造型,通俗易懂,符合信息设计的简练★■■★◆、快速阅读的特点。用此方法制作的数据新闻能生动形象的呈现新闻主体的特征,便于受众的理解★■。在央视的《数字十年》所报道的专题《守住18亿亩耕地红线)用禾苗的简影图代表农业用地的概念,用一碗米饭代表所消费的口粮,而用挖掘机、楼房的简影图代表工业建筑用地■◆★★◆◆,直观形象■■。
电视媒体通过非线性编辑连接片段,配上音乐以及解说词构成一个持续动态的视频信息。连续性的、动态可视化展现也是电视媒体有别于报纸杂志之处■◆◆■★,电视是集视觉、听觉为一体的艺术表现形式■■◆,声音、动画作为节目包装的重要组成部分,对视频的整体效果和信息传递效果发挥着举足轻重的作用■■◆◆★。
以往的电视媒体对数据的运用主要体现在公布相关部门的统计、调查结果◆◆■,自己无法采集到详实的数据信息■★。在大数据时代★◆■◆◆,传统电视媒体可以在合法、公开的渠道获取更全面的数据★★◆■◆,再经过专业的分析◆◆◆◆★■、处理,使抽象的数据具象化的呈现在电视屏幕上◆★★◆■,产生数据新闻。这里对数据新闻进行分析与处理是指,专业人员运用数据可视化的方法收集并整理信息。数据可视化旨在借助于图形化手段,清晰有效地传达与沟通信息◆★★◆。为了有效地传达思想概念★■■,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。 帮助受众迅速定位对自己有用的信息,实现人与数据的互动,通过数据的可视化呈现进行关系的比对、更加深入的分析★◆★,帮助受众更及时而直观的了解事件的最新动态,也增添了接受新闻的趣味性。
除了对具体的数据新闻报道的“可视化”,电视媒体也开始利用★■“词云★◆”这一概念★◆★★,将新闻关注度进行“可视化”的呈现◆★■。◆■■◆■“词云”就是对网络文本中出现频率较高的关键词予以视觉上的突出★★◆★◆,形成“关键词云层■◆■★”,从而过滤掉大量的文本信息■★★★,使浏览网页者只要一眼扫过文本就可以领略文本的主旨◆◆◆★。 词云已成为时下文本关键词、高频词分析中一种十分常见的可视化手段。
(图1:数据新闻记者Mirko Lorenz曾经提出的数据新闻工作流程)
此外◆■■,在大数据时代★★★■◆,除了提升记者个人的能力,使用可视化软件、构建大数据的多维思维,用数据说话以外,媒体机构也已经有了部门融合的意识,将“传统媒体人”向“数据媒体团队”转变★★。澳大利亚全国广播公司(ABC)实现了多部门的人才融合,组建了集合网页开发◆★◆、设计人员、数据采集■★、分析人员、数据挖掘◆◆■★■■、图像可视化技术人员等七类技术人才。央视更是实现了跨界合作◆★★,与网络媒介融合,和百度联手制作节目。央视负责可视化的电视画面呈现以及后期包装,百度负责搜集■■■★◆、整合技术,强强联手打造出了《数字十年》、《据说春运》、《据说两会》等中国电视可视化数据新闻的里程碑式节目■■◆◆。
可视化“数据新闻”作为大数据时代背景下的一种新的传播方式,形成了新的电视新闻报道形态。本文归纳数据新闻可视化的四种方法,主要有仿影图形法◆★,实现事物的“可视化”;由数到物,实现数据的“可视化◆■”;逻辑关系的“可视化■◆■★■”★◆■■■;加入声音与动画,形成连续动态的可视化。并结合电视媒体的可视化实践★◆★◆,分析数据食物链对新闻编辑团队的价值与影响。
在央视所呈现的★■◆■★“可视化”数据新闻中(见图3)◆■,设计者以东方明珠代表上海,将下降的3700万亩转换为四个上海的城市剪影◆◆■◆■■,使得受众对数据的感知就更加具体,从而明确事件的严重性,树立保护耕地、减少占用耕地的意识★■。
编者按:近期■★◆,互联网应用适老化改造成为舆论热点。相比尚不熟悉互联网的老人,已经能够熟练掌握互联网应用操作的老年网民同样面临网络谣言、网络诈骗、虚假广告等陷阱,他们抵御风险的能力远低于年轻网民。…
数据本身是中性的,它不存在任何偏向,只有在特定的语境中才被赋予意义。在图像时代■◆★◆,电视新闻视觉化的意义就是要把单一的数据通过信息化图表呈现出来,这一过程是电视新闻工作者传递、解释新闻的重要路径★★◆★■。 数据可视化的主要表现形式是信息图表。根据Doug Newsom的概括■■■◆,作为视觉化工具的信息图表包括:图表(chart)、图解(diagram)、图形(graph)■★◆◆■、表格(table)、地图(map)和列表(list)等。 以上的可视化处理方法都使数据更加具象化,实现数据的“可视化”的关键,就是将“数”的概念转为◆★“物■★◆■”的概念。在《守住18亿亩耕地红线》中有一段是这样表述的★◆★◆:“1996年我国的耕地面积是19.51亿亩,到了2001年下降到19.14万亩★■,这五年来下降了3700万亩◆■■,这相当于四个上海的面积■◆◆■。”由于电视受众对3700万亩没有一个明确的概念◆◆◆■■◆,若单纯的将数据呈现,则不是我们所指的“可视化”数据新闻。
平面媒体上的可视化的信息是静态的★◆◆,单一的。而电视数据新闻■★“可视化”的表现形态是连续的、动态的◆◆◆★、多元的,数据与数据之间■◆◆■、数据与事物之间、事物与事物之间的逻辑关系的清晰呈现就尤为重要■◆。
在现代社会数字化与智能化飞速发展的当下,老年人与互联网之间的“数字鸿沟”已成为必须逾越的课题。2020年底■★■■,工信部正式印发《互联网应用适老化及无障碍改造专项行动方案》。…
虽然不同媒体的数据新闻工作流程各有千秋,但从大方向上来看,都始终都是围绕着“大数据技术◆■”以及◆★■★“可视化技术”这两个核心展开◆★◆■■■,进行资源的融合◆★。虽然在数据新闻发展过程中◆★■◆◆,可视化技术与大数据技术的对接尚未成熟,也存在一系列问题亟待解决■◆★◆,但“可视化■★◆■★◆”数据新闻横跨新闻传播■■◆、数据分析、统计、编程★■■◆■、设计等诸多领域,真正体现了“传媒是科学、技术和艺术的集合”,也由此形成了新的电视新闻报道形态,进一步提升了新闻价值。
加入声音与动画,形成动态的可视化,就是对可视化数据新闻进行后期加工与组织◆◆★◆◆,将内容形象化■■,信息秩序化的呈现。在2011年◆■★■■,一条由网友制作的短片《十分钟◆■,让你了解上海》在互联网上走红。节目用动画展现上海的变迁,配上轻松的音乐以及具有磁性的配音,使得城市数据解读具有趣味性,吸引了大家的眼球■■■■★■。随后《十分钟了解中国》、《九分钟了解成都》等用动画表现大数据的介绍类节目风靡网络◆★◆◆■◆。如今★◆■★■,央视推出的《据说两会》《数说十年》等数据新闻类节目也推出了一系列报道,给“可视化”的数据新闻配上欢快的音乐、口语化的解说、连续而具有趣味性的动画演示,给受众带来新鲜感。