
| (1)数理统计的基本概念 | 总体 | 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。 |
| 个体 | 总体中的每一个单元称为样品(或个体)。 | |
| 样本 | 我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我们称之为样本的两重性。 | |
| 样本函数和统计量 | 设为总体的一个样本,称 () 为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。 | |
| 常见统计量及其性质 | 样本均值 样本方差 样本标准差 样本k阶原点矩 样本k阶中心矩 ,, ,, 其中,为二阶中心矩。 | |
| (2)正态总体下的四大分布 | 正态分布 | 设为来自正态总体的一个样本,则样本函数 |
| t分布 | 设为来自正态总体的一个样本,则样本函数 其中t(n-1)表示自由度为n-1的t分布。 | |
| 设为来自正态总体的一个样本,则样本函数 其中表示自由度为n-1的分布。 | ||
| F分布 | 设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数 其中
表示第一自由度为,第二自由度为的F分布。 | |
| (3)正态总体下分布的性质 | 与。 | |
| (1)点估计 | 矩估计 | 设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。 若为的矩估计,为连续函数,则为的矩估计。 | |
| 极大似然估计 | 当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称 为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为,则称 为样本的似然函数。 若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。 若为的极大似然估计,为单调函数,则为的极大似然估计。 | ||
| (2)估计量的评选标准 | 无偏性 | 设为未知参数的估计量。若E ()=,则称 为的无偏估计量。 E()=E(X), E(S2)=D(X) | |
| 有效性 | 设和是未知参数的两个无偏估计量。若,则称有效。 | ||
| 一致性 | 设是的一串估计量,如果对于任意的正数,都有 则称为的一致估计量(或相合估计量)。 若为的无偏估计,且则为的一致估计。 只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 | ||
| (3)区间估计 | 置信区间和置信度 | 设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即 那么称区间为的置信区间,为该区间的置信度(或置信水平)。 | |
| 单正态总体的期望和方差的区间估计
| 设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下: (i)选择样本函数; (ii)由置信度,查表找分位数; (iii)导出置信区间。 | ||
| 已知方差,估计均值 | (i)选择样本函数 (ii) 查表找分位数 (iii)导出置信区间 | ||
| 未知方差,估计均值 | (i)选择样本函数 (ii)查表找分位数
(iii)导出置信区间 | ||
| 方差的区间估计 | (i)选择样本函数 (ii)查表找分位数
(iii)导出的置信区间 | ||
| 基本思想 | 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件,其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。 | |
| 基本步骤 | 假设检验的基本步骤如下: (i)提出零假设H0; (ii)选择统计量K; (iii)对于检验水平α查表找分位数λ; (iv)由样本值计算统计量之值K; 将进行比较,作出判断:当时否定H0,否则认为H0相容。 | |
| 两类错误 | 第一类错误 | 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即 P{否定H0|H0为真}=; 此处的α恰好为检验水平。 |
| 第二类错误 | 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即 P{接受H0|H1为真}=。 | |
| 两类错误的关系 | 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。 | |
| 条件 | 零假设 | 统计量 | 对应样本 函数分布 | 否定域 |
| 已知 | N(0,1) | |||
| 未知 | ||||
| 未知 | ||||
