邰为伟
2015.9.6
目 录
1、商业背景说明
2、表一、表二、表三、表四
3、大数据的原理
4、个人期望
商业背景说明
本次大数据分析以商业中某店的营业数据为依据,一切分析皆来源于事实数据,对数据进行分布图的加工处理,本次的工具利用了本人工作中的广联达GCL软件,进行三维分布图和二维平面图的绘制。
表一:每日营业总额----星期时间(二维图)
如下所示,此处列举三个
根据图一,可以得知:
1、每个星期的销售总额的走向
2、每个星期哪一天的销售总额最高,最低
3、以月为单位,随着气温变化,每个月的星期销售总额的趋向
表二:每日每个产品收入额----星期时间---每个产品数量(三维分布图)
如下所示,此处列举三个
根据图二,可以得知:
1、每天哪个产品销售额最高,最低
2、销售额最高的产品有哪些,分析相关关系
3、每个星期销售额高的主要分布区域
4、随着产品的数量增多,后来增加的新产品的销售情况及分布
5、单件产品在每个星期的销售额的走向,哪天最高,最低
6、单件产品在每个星期的分布,出现的频率
表三:每日每个产品收入额----天气---每个产品数量(三维分布图)
如下所示,此处列举一个
根据图三,可以得知:
1、每个星期每件产品随着天气的变化的销售额的走向。
2、分析出哪些产品受天气影响的相关程度比较大或小
3、同一天气中的单件产品,哪些是销售额正相关或负相关
表四:4月6日的每件产品的销售额的分布图(研究正态分布)
研究分布图发现,每日的单件产品的销售额分布呈正态分布,几大特性如下:
1、集中性,正态曲线的高峰位于正
2、对称性,正态曲线以均数为中心,左右对称
3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
由于时间关系,本人只分析以上几种分布图,另外的影响相关因素,如不同收入方式(现金、美团、团购等)的销售总额比例趋势,一天中支付时间点的分布,商场在某日举行的大型活动,员工男女比例,员工总数,年龄分布,产品单价的调整等等,都有可能影响销售营业总额。另外,还可以分析店内的视频,采纳其中的数据,如消费者在柜台消费前,消费中的行为表情,坐在店内品尝时的消费行为等,这样通过细节,分析出消费者的行为,消费者在店内的停留时间等,做出相关的配合商业行为,比如增加WIFI,提供更好的餐饮环境,更好的体验。
根据大数据分布图的分析,可作为相应的商业决策,安排,策划,营销,资源的协调及优化,节约成本等的事实依据,如根据正相关销售的产品,可以绑定销售等等。
其实,大数据分析得出的结论,比如说某个热销产品,它的营业额在一天中很长一段时间内保持最大,也就是说这个产品符合大众的口味,受到广大消费者的喜爱,那么问题来了,大数据分析得出的结论,它的依据是什么呢?这就不得不说到大数据的背后原理。
大数据的原理
我们通过大数据分析得出的结论,往往可以作为我们商业优化的依据,因为它是以事实数据为依据,但是在这背后,却隐藏着一些机理,由于这些机理的运作支持,大数据的真正内涵价值得以爆发出来。接下来,就谈谈个人认知的大数据的背后原理包括哪些。
1、大数定律
由数学家伯努利提出,概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。 概率论中讨论随机变量序列的算术平均值向常数收敛的定律。它是一种描述当试验次数很大时所呈现的概率性质的定律。但是注意到,虽然通常最常见的称呼是大数“定律”,但是大数定律并不是经验规律,而是严格证明了的定理。
有些随机事件无规律可循,但不少是有规律的,这些“有规律的随机事件”在大量重复出现的条件下,往往呈现几乎必然的统计特性,这个规律就是大数定律。简单来说,大数定理就是当试验次数足够多时,事件出现的频率无穷接近于该事件发生的概率。
2、中心极限定理
中心极限定理是概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量积累分布函数逐点收敛到正态分布的积累分布函数的条件。
在自然界与生产中,一些现象受到许多相互的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。
中心极限定理是研究随机变量和的极限分布为正态分布的问题。
3、正态分布
正态分布又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。
4、幂律
幂律来自上世纪20年代对于英语单词频率的分析,真正常用的单词量很少,很多单词不常被使用,语言学家发现单词使用的频率和它的使用优先度是一个常数次幂的反比关系。简单来说,幂律就是两个通俗的定律,一个是“长尾”理论,只有少数大的门户网站是很多人关注的,但是还有一个长长的尾巴,就是小网站,小公司。长尾理论就是对幂律通俗化的解释。另外一个通俗解释就是马太效应,穷者越穷富者越富。
个人期望
本人通过对这次的商业大数据的分析以及相关成果,希望为大数据的发展作出一点个人贡献。
大数据在商业中的应用价值非常广泛,个人认为未来数据的处理加工决非本人这次的方法。分析了大数据的原理,加工处理还是要通过计算机进行相关程序的编程,软件处理数据,得出结果。
对未来大数据的发展摸索,愿一起探寻。