伯努利分布
说明与例:x为伯努利试验的结果,当试验成功,则x=1,试验失败则x=0。可以把伯努利试验理解为抛硬币,x=1为出现正面
●Binomial ( n, p )
二项分布
(图以p=0.4,n=5为例)
说明与例:x是重复n次的伯努利试验结果,即x=试验成功的次数,可以理解为抛n次硬币,正面出现的次数。
●Multinomial ( m, p1, ..., pn )
多项分布
图略(因为是联合分布的分布)
说明与例:多项分布是二项分布的推广,二项分布结果只有两个,而多项分布结果可以有多个,比如仍骰子,x1表示n次试验点数1出现的次数…x6表示点数6出现的次数。
●Geometric ( p )
几何分布
(图以p=0.4为例)
说明与例:得到一次成功而进行的伯努利试验次数n,即前面失败了n-1次,第n次成功。比如x可以理解为抛硬币,出现正面所抛的次数
●Hypergeometric
超几何分布
(以N=10,m=5,n=4为例)
说明与例:已知N个总体中有m个不合格的产品,现在抽取n个,出现不合格产品的数量。
●Negative binomial ( r, p )
负二项分布
(改图来自维基百科,反映了一个大致的变动趋势http://zh.wikipedia.org/wiki/%E8%B4%9F%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83)
(这是以r=3,p=0.4为例进行模拟得到的)
说明与例:在一连串伯努利试验中,一件事刚好在第r+k次试验出现第r次的概率,如做了3+1次试验,每次成功概率为0.4, 那么该试验刚好在第四次出现第三次成功的概率就为0.1152
●Poisson ( λ )
泊松分布
说明与例:泊松分布多用来描述单位时间(面积)内随机事件发生的次数,参数λ是单位时间(面积)内随机事件的平均发生率,如显微镜下单位分区内的细菌分布数、服务设施在一定时间内受到的服务请求次数等。
●Beta ( α, β )
贝塔分布
其中
说明与例:某变量取某一个有限长度(时间)中的某一段长度(时间)时,该变量表现为贝塔分布,如心理学中认为,一个正常人在整个睡眠中,异相睡眠所占的比例服从贝塔分布。(参考资料:维基百科
http://en.wikipedia.org/wiki/Beta_distribution
贝塔分布的有关性质及应用探讨
http://wenku.baidu.com/view/0a47fd86bceb19e8b8f6ba97.html)
●Cauchy (θ, σ )
柯西分布
Mean and variance Do not exist
If X and Y are independent N(0,1), X/Y is Cauchy
说明与例:柯西分布于正态分布的图形有点像,但柯西分布的图形下降至0的速度更快,如第2张图中,下面的那个是柯西分布。柯西分布用来描述共振行为,如在物理学中描述受迫共振的微分方程的解,在光谱学中描述共振或者其他机制加宽的谱线性状。
●Chi squared ( p )
卡方分布
说明与例: k个的标准正态分布变量的平方和服从自由度为k的卡方分布。在性检验、样本对总体的拟合程度等中常常用到。
●Double exponential ( μ, σ )
双参指数分布
(以double exponential(1,2)为例,即把单指数分布exponential(2)右移1个单位,在按照对称轴x=1反转)
●Exponential ( β )
指数分布
以(exponential(2)为例,便于与exponential(1,2)对比)
(来自维基百科)
说明与例:指数分布常用于等待时间,因为它具有“无记忆性”
即,已经等待了10分钟,再等待5分钟的概率,与已经等待30分钟,再等待50分钟的概率是一样的。
●F
F分布
说明与例:常用于统计检验,如方差分析、估计模型的拟合效果等
●Gamma ( α, β )
伽马分布
(来自维基百科)
说明与例:G(a,b)意义是,如果某事件发生一次需要时间b(1/b即该事件的发生频率),那么x为等到第a事件发生时所需的时间),比如,经济衰退发生一次要3年,那么第2次经济衰退的时间就服从G(2,3)的伽马分布(现实中并没求证,只是举个例子)
●Logistic ( μ, β)
逻辑分布
这个分布之前没听说过,在excel也没有相关函数对其分布进行模拟
●Lognormal (μ, α)
对数正态分布
(来自维基百科)
说明与例:当x服从正态分布时,y=exp(x)就服从对数正态分布。变量可以看做是很多很小的因子乘积时候,该变量多服从对数正态分布,比如股票投资的长期收益率,它是每天收益率的乘积。
●Normal (μ, σ2 )
正态分布
说明与例:最广泛的分布,试验过程中的随机误差多呈现正态分布,很多医学、经济、人口指标都服从或近似服从,如同质群体的身高、红细胞数、血红蛋白量、人的智力等等
●Pareto ( α, β )
帕累托分布
说明与例:帕累托来源于对财富的观察:20%的人掌握了80%的财富,因此帕累托分布的例子有:中产阶级崛起之前,财富在个人之间的分布、人类居住区域的大小、油田石油贮备数量(都是前面少部分掌握了最大部分的资源)
●T
T分布
(来自维基百科)
说明与例:在一些检验中,由于总体标准差是未知的,小样本情况下,再用u检验会产生很大的误差,用t检验改进以获得准确的结果,如两样本的t检验。
●Uniform (a, b)
均匀分布
说明与例:当x在a~b之间取任何一个值都是等可能时,此时x服从均匀分布。如掷骰子,x出现的点数。
●Weibull ( γ, β )
威布尔分布
说明与例:寿命常服从这个分布,如滚动轴承的寿命等,因此在生存分析、工业产品制造、可靠性和失效分析、寿险模型等中用到很多