第四章 新媒体数据分析 | 建立目标任务 明确重难点 课程导入,激发学习兴趣。 讲授法,建立学习内容的总体印象。 讲授法、案例分析法 讲授法、案例分析法 讲授法、案例分析法 讲授法,结合教材讲解六种流量数据分析的内涵。 讲授法,结合教材讲解销售分析的内涵。 讲授法,结合教材讲解内容分析的特点及要点。 讲授法,结合教材讲解执行分析的内涵。 讲授法、案例分析法 讲授法、演示法,讲解六种相对数比较。 讲授法、演示法 讲授法、演示法 讲授法、演示法。引导学生利用手机扫描二维码线上线下相结合详细学习KANO模型。 第(五)至(九)讲授法、演示法 课堂实验:指导学生进行相关性、贡献度、平均、矩阵分析实验。 布置作业、巩固知识,进行形成性评价。 教学反思 |
一、课时安排:课时(理论讲授7课时,实践5课时) | |
二、教学课型:理论、实践课 | |
三、教学目标: | |
(1)了解新媒体数据分析的作用。 | |
(2)了解新媒体数据分析的类别。 | |
(3)掌握新媒体数据分析误区的规避。 | |
(4)掌握新媒体数据分析的方法。 | |
(5)掌握新媒体数据分析的应用。 | |
四、教学重点难点: | |
(1)新媒体数据分析类别。 | |
(2)新媒体数据分析误区规避。 | |
(3)新媒体数据分析方法。 | |
五、教学方法: | |
多媒体教学(讲授法、实验法) | |
六、教学过程与内容: | |
课程导入: | |
新媒体数据分析在不同领域的需求和作用。 | |
本章概述: | |
新媒体数据分析是指运用适当的统计分析方法对收集来的大量新媒体数据进行分析,将它们加以汇总理解,以求最大化地开发数据的功能,发挥数据的作用。本章首先介绍了新媒体数据分析在新闻内容创作、媒体运营策略以及网络舆情监测三大领域的作用。其次,本章讲解了新媒体数据分析的四大类别,分别是流量分析、销售分析、内容分析和执行分析。再次,本章辨析了新媒体数据分析的三大误区,分别是要全部不要抽样、要混杂不要精确、要相关不要因果。最后,本章以旅游APP的数据为例,综合运用了相关性分析法、贡献度分析法、平均分析法以及矩阵分析法等四种分析方法,在实践中领悟每种分析方法的适应情境。 | |
第一节 新媒体数据分析作用 | |
(一)新闻内容创作 1、新闻选题创新 传统的新闻选题——记者依据传统的新闻价值准则进行选择;数据分析——挖掘以往人为发现不了的新颖选题角度和方向,从科学统计的视角提供新闻线索。 2、内容深度专业 数据分析为专题新闻深度报道提供了丰富的数据来源和科学的数据支撑,这对于社会、财经、体育、突发类自然灾害等新闻的报道有重要意义。在自媒体日益喧嚣的今日,数据分析可以有效成为专业媒体的利刃和优势,帮助其向智库媒体转型。 3、效果评估准确 主要分为两大类:一是评估新闻的传播效果和路径,包括对新闻的阅读量、转发量、点赞量、评论量、传播平台等数据的分析;二是评估读者特征,包括对读者的年龄、性别、职业、兴趣的分析。新闻工作者可根据准确、及时的效果评估进一步提升新闻制作水平,优化传播路径,完成更加高质量的新闻作品。 (二)数据营销推广 1、目标用户锁定 新媒体运营者可以通过品牌官网、品牌公众号等了解到用户性别、地域、年龄、购物偏好、评价等数据,有助于产品方锁定自身用户,获取新用户,维护老用户。 2、精准场景推送 随着移动通讯、空间定位、大数据等多种信息技术的发展,基于位置的服务(Location Based Services,LBS)越来越多应用到营销领域,商家可以利用移动互联网络服务平台获取用户位置相关信息,并对数据进行更新和交互,从而为用户提供相应服务。例如,美团可根据用户位置推荐附近商家。 3、营销成本控制 根据目标用户的常用App、支付方式、消费金额等数据,优化广告投放渠道,实现精准营销,节约推广成本。 4、营销方案评估 营销方案执行效果需要通过数据进行评估。可以运用逆向工程思维,通过最终完成数据,反推出方案中目标的可行性;也可以分析过程数据,及时发现方案制定后在执行过程中遇到的问题,作为下次营销方案制定的参考。在评估营销方案中常用到的数据包括目标达成率、最终销售额、过程异常数据以及失误率等。 (三)网络舆情监测 1、展现舆情传播路径 首先可以展现当前舆情所处的爆发阶段——潜伏期、爆发期、蔓延期、缓解期、反复期、消退期。其次,了解舆情事件的传播渠道分布。最后,还可以预判舆情未来的传播走势,为进一步的监测应对提供支撑。 2、反映舆情话题热度 话题分析包括网民观点和媒体观点。数据分析可以帮助实现话题的关键词分布情况以及话题倾向性分布情况。对舆情话题进行聚类可以了解网民和媒体对该舆情事件的关注焦点。 3、揭示网民情感态度 随着近年来事件本身和传播环境的愈发复杂、话语权的不断分散,尤其是网民理性与感性的角力,网民的情感态度愈发复杂。因此,通过科学专业的媒体数据分析揭示网民复杂多样的情感态度对网络舆情监测有着重要作用。 | |
第二节 新媒体数据分析类别 | |
新媒体数据分析可按照以下标准分类: (1)按照数据呈现形式可以分为数值型和图文型两类。 数值型数据多为结构化数据,主要由数字组成,比如阅读量、粉丝量、网店的销售数据、网站的浏览数据等。图文型数据多为半结构化或非结构化数据,例如网站栏目分类、账号粉丝分类、消费者反馈以及各种平台的矩阵分布等。 (2)按照数据分析功能可以分为流量分析、销售分析、内容分析以及执行分析四大类。 相比较于第一种分类方法,第二种分类方法充分考虑到新媒体数据的情境性与实用性,因此本书着重按照第二种分类方法介绍新媒体数据分析。 (一)流量分析 流量分析即网站或网店流量分析,通过对访问量、访问时间、跳出量、跳出率等流量数据进行分析,可以评估网站运营的基础情况。随着智能手机的普及,越来越多的网民开始利用手机打开网页,因此现阶段流量分析的重点是移动端流量数据分析,包括报名表单访问量、H5访问量、微网站流量、微网站跳出率等。 (二)销售分析 销售分析即对互联网产生的下单数量、支付比例、二次购买比例等进行分析,寻找当前互联网销售的问题。需要强调的是,销售分析不仅限于在网上消费,消费者线上预定线下消费,即O2O(Online to Offline)也可算作销售分析的范畴。 (三)内容分析 1、内容特点 碎片化,丰富性,非线性。 2、分析要点 标题,关键词、标签,发布情况,超链接,评论,背景音乐。 (四)执行分析 执行分析即对团队成员的日常执行工作与评估,包括文章撰写速度、客服影响速率等。新媒体工作是否有效率,可以借助执行数据进行分析。 | |
第三节 新媒体数据分析误区规避 | |
(一)要全部不要抽样 19世纪以来,当面临大量数据时,社会都依赖于采样分析。但是采样分析是信息缺乏时代和信息流通受的模拟数据时代的产物。它本身存在许多固有的缺陷,其成功依赖于采样的绝对随机性,一旦采样过程中存在任何偏见,分析结果就会相去甚远。以前我们通常把这看成是理所当然的,但是现在廉价的存储设备、高性能的运算能力让我们意识到,这其实是一种人为的。与局限在小数据范围相比,“样本=总体”让我们看到了一些以前样本无法揭示的细节信息。 (二)要混杂不要精确 1、数据类型的多样性 新媒体数据分为结构化数据、半结构化数据以及非结构化数据三大类型。结构化数据是指可以用关系型数据库表示和存储,表现为二维形式的数据。半结构化数据是指不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但是包含相关标记,用来分割语义元素以及对记录和字段进行分层。非结构化数据就是没有固定结构的数据。 2、数据的不精确性 接受数据的不精确性是因为在大数据时代,我们关注的通常是趋势和方向,在海量数据中,个别数据的不精确一般不会影响某种趋势和方向。而且数据类型的多样性有时决定了很难达到数据的精确性,比如对短视频内容的检索和分析。 (三)要相关不要因果 所谓相关关系,其核心是指量化两个数据值之间的数理关系,建立在相关关系分析法基础上的预测是大数据的核心。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。 | |
第四节 新媒体数据分析方法 | |
(一)对比分析法 对比分析法是把客观事物加以比较,以达到认识事物的本质和规律并做出正确评价的方法。对比分析法通常是把两个相互联系的指标数据进行比较,从数量上展示和说明研究对象规模的大小、水平的高低、速度的快慢以及各种关系是否协调。 对比分析包括绝对数比较和相对数比较两种形式。绝对数比较是利用绝对数进行对比,从而寻找差异的一种方法。相对数比较包括结构相对数、比例相对数、比较相对数、强度相对数、计划完成程度相对数和动态相对数。 (二)分组分析法 分组分析法是指通过统计分组的计算和分析,来认识所要分析对象的不同特征、不同性质及相互关系。分组分析法是在分组的基础上,对现象的内部结构或现象之间的依存关系从定性或定量的角度做进一步分析研究,以便寻找事物发展的规律,正确地分析问题和解决问题。 分组时必须遵循两个原则:穷尽原则和互斥原则。所谓穷尽原则,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。所谓互斥原则,就是在特定的分组标志下,总体中的任何一个单位只能归属于某一个组,不能同时或可能归属于几个组。 (三)平均分析法 平均分析法就是用平均数来衡量总体在一定时间和地点条件下某数据的一般水平。平均数据比总量指标更具说服力,更能帮助运营者预测发展趋势和规律。 平均分析法包括数值平均数和位置平均数,数值平均数又包括算术平均数、调和平均数和几何平均数,其中最常用的是算术平均值,即算术平均值=总体各数据的总和/数据个数。位置平均数又包括众数和中位数,众数直观地反映了总体的集中趋势,中位数代表了现象的一般水平。 (四)矩阵分析法 矩阵分析法是一种定量分析数据的方法。它是指以数据两个重要指标作为分析依据,并将这两个指标作为横、纵坐标轴,构成四个象限,从而找出解决问题的方法,为运营者提供数据参考。 以经典的KANO模型为例:以分析用户需求对用户满意的影响为基础,体现了产品性能和用户满意之间的非线性关系。如图所示,横纵坐标分别表示产品的功能具备程度和用户的满意度。 (五)网络分析法 网络分析法是一种分析处于同一网络中的各个节点之间的互动以及各节点的权重关系的方法。新媒体时代的交互性和去中心化更加凸显了网络分析法的重要价值。 本节内容以Python中的Networkx包为基础,以人民日报发布的157则短视频标题文字为语料,介绍网络分析法,举例见教材P96-P100。 (六)相关性分析法 相关性分析是指分析连续变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。大数据时代,数据间的相关关系比因果关系更加重要。在媒体营销中,可以通过比较两个商品的相关关系强弱来选择是否进行组合销售。 (七)贡献度分析法 贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品。而随着互联网的发展,长尾理论日益凸显价值。它是指只要产品的存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可以和那些少数热销产品所占据的市场份额相匹敌甚至更大,即众多小市场汇聚成可产生与主流相匹敌的市场能量。贡献度分析的意义在于通过找到贡献了80%利润的产品界限,帮助公司运营者区分热销产品和长尾商品,从而制定针对性的销售策略。 贡献度分析的公式为:贡献度=累积贡献数/总数×100%。 (八)周期性分析法 周期性分析是探索某个变量是否随着时间变化而呈现出来某种周期变化趋势。按照时间尺度的标准划分,较长的周期性趋势有年度周期性趋势、季节性周期性趋势;相对较短的有月度周期性趋势,周度周期性趋势,甚至更短的天、小时周期性趋势。 (九)回归分析法 回归分析是通过研究事物发展变化的因果关系来预测事物发展的趋势,它是研究变量间相互关系的一种定量预测方法。可通过对大量数据的处理来确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。 根据因变量和自变量的个数分为:一元回归分析和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;根据因变量和自变量的函数表达式分为:线性回归分析和非线性回归分析。 新媒体数据分析中,通过已有数据的分析进行预测也是重要应用之一,回归分析法为新媒体数据预测分析提供了重要支持。目前很多软件或平台都能实现回归分析,如Excel、SPSS、Tableau等,以下将对Excel和Tableau软件中回归分析的操作及预测的应用进行阐述。 | |
第五节 新媒体数据分析应用 | |
本节在将在上一章数据预处理实例的基础上,继续对该旅游APP的数据进行分析。 (一)相关性分析 计算总入住消费分别与年龄、总入住次数、最后一次入住时间至调查截止时间时长(天)、平均入住时间间隔(天)、总入住积分、总其他积分、总精英积分、积分兑换次数、平均折扣率以及总累计积分的相关系数,比较各因素影响总入住消费金额的强弱。 (二)贡献度分析 为确定精英客户的范围,将总入住消费进行贡献度分析,找出为该旅游APP酒店服务贡献了80%金额的会员号。对总入住消费金额从大到小排列后,发现前244位会员贡献了超过80%的金额。 (三)平均分析 根据总入住消费和总入住次数,计算平均入住消费,公式如下: 平均入住消费=总入住消费/总入住次数。 (四)矩阵分析 以平均入住时间间隔和平均入住消费(平均分析法求得)两个重要指标作为分析依据,并将其作为横、纵坐标轴,构成四个象限,分析客户特征,得出四大客户群体。 | |
思考与练习: | |
(1)新媒体数据分析有哪些作用? (2)新媒体数据分析有哪些类别? (3)新媒体数据分析方法有哪些,如何应用? (4)如何利用python进行网络分析? | |
教学反思: | |
(1)教学成功之处: (2)教学不足之处: (3)学生获得知识和创新(知识掌握、技能获取、价值观理念树立): (4)改进措施: |