1.排列及计算公式
从n个不同元素中,任取m(m≤n)个元素按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列;从n个不同元素中取出m(m≤n)个元素的所有排列的个数,叫做从n个不同元素中取出m个元素的排列数,用符号p(n,m)表示.
p(n,m)=n(n-1)(n-2)……(n-m+1)= n!/(n-m)!(规定0!=1).
2.组合及计算公式
从n个不同元素中,任取m(m≤n)个元素并成一组,叫做从n个不同元素中取出m个元素的一个组合;从n个不同元素中取出m(m≤n)个元素的所有组合的个数,叫做从n个不同元素中取出m个元素的组合数.用符号
c(n,m) 表示.
c(n,m)=p(n,m)/m!=n!/((n-m)!*m!);c(n,m)=c(n,n-m);
3.其他排列与组合公式
从n个元素中取出r个元素的循环排列数=p(n,r)/r=n!/r(n-r)!.
n个元素被分成k类,每类的个数分别是n1,n2,...nk这n个元素的全排列数为n!/(n1!*n2!*...*nk!).
k类元素,每类的个数无限,从中取出m个元素的组合数为c(m+k-1,m).
排列(Pnm(n为下标,m为上标))
Pnm=n×(n-1)....(n-m+1);Pnm=n!/(n-m)!(注:!是阶乘符号);Pnn(两个n分别为上标和下标)=n!;0!=1;Pn1(n为下标1为上标)=n 组合(Cnm(n为下标,m为上标))
Cnm=Pnm/Pmm ;Cnm=n!/m!(n-m)!;Cnn(两个n分别为上标和下标) =1 ;Cn1(n为下标1为上标)=n;Cnm=Cnn-m
排列定义从n个不同的元素中,取r个不重复的元素,按次序排列,称为从n个中取r 个的无重排列。排列的全体组成的集合用P(n,r)表示。排列的个数用P(n,r)表示。当r=n时称为全排列。一般不说可重即无重。可重排列的相应记号为P(n,r),P(n,r)。
组合定义从n个不同元素中取r个不重复的元素组成一个子集,而不考虑其元素的顺序,称为从n个中取r个的无重组合。
组合的全体组成的集合用C(n,r)表示,组合的个数用C(n,r)表示,对应于可重组合
有记号C(n,r),C(n,r)。
概率统计
【考点透视】
1.了解随机事件的发生存在着规律性和随机事件概率的意义.
2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率.
3.了解互斥事件、相互事件的意义,会用互斥事件的概率加法公式与相互事件的概率乘法公式计算一些事件的概率.
4.会计算事件在n 次重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 【例题解析】
考点1. 求等可能性事件、互斥事件和相互事件的概率 解此类题目常应用以下知识:
(1)等可能性事件(古典概型)的概率:P (A )=)
()(I card A card =n
m ;
等可能事件概率的计算步骤:
① 计算一次试验的基本事件总数n ;
② 设所求事件A ,并计算事件A 包含的基本事件的个数m ; ③ 依公式()m P A n
=
求值;
④ 答,即给问题一个明确的答复.
(2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:重复试验的概率:P n (k )=k
n k k n p p C --
)
1(.其中P 为事件A 在一次试验中发生的
概率,此式为二项式[(1-P)+P]n
展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: ①
求概率的步骤是:
第一步,确定事件性质⎧⎪⎪⎨
⎪⎪⎩
等可能事件
互斥事件
事件 n 次重复试验
即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算⎧⎨
⎩和事件积事件
即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.
第三步,运用公式()()()()()()()()(1)
k k n k n n m P A n
P A B P A P B P A B P A P B P k C p p -⎧
=⎪⎪⎪
+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 事件: n 次重复试验:求解
第四步,答,即给提出的问题有一个明确的答复.
例1.在五个数字12345,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).
[考查目的]本题主要考查概率的概念和等可能性事件的概率求法. [解答过程]0.3提示:1
33
5C 33.
54C
10
2
P
==
=
⨯
例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .
[考查目的]本题主要考查用样本分析总体的简单随机抽样方式,同时考查概率的概念和等可能性事件的概率求法.
用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法. [解答过程]
1.20
提示:51.100
20
P =
=
例3从自动打包机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g ):
492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499
根据的原理,该自动包装机包装的袋装食盐质量在497.5g~501.5g 之间的概率约为__________.
[考查目的]本题主要考查用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法.
[解答过程]在497.5g~501.5内的数共有5个,而总数是20个,所以有
51.20
4=
点评:首先应理解概率的定义,在确定给定区间的个体的数字时不要出现错误.
例4.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)
[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.
[解答提示]至少有3人出现发热反应的概率为
3
3
2
4
4
5
5
5550.800.200.800.200.800.94
C C C ⋅⋅+⋅⋅+⋅=.
故填0.94.
例5.右图中有一个信号源和五个接收器.接收器与信号源在同一个串联线路
中时,就能接收到信号,否则就不能接收到信号.若将图中左端的六个接线点随机地平均分成三组,将右端的六个接线点也随机地平均分成三组,再把所有六组中每组的两个接线点用导线连接,则这五个接收器能同时接收到信号的概率是
(A )
45
4 (B )
36
1 (C )
15
4 (D )
15
8
[考查目的] 本题主要考查运用组合、概率知识,以及分步计数原理解决问题的能力,以及推理和运算能力.
[解答提示]由题意,左端的六个接线点随机地平均分成三组有2
2
2
2
3
315C C C A
=种分法,同理右端
的六个接线点也随机地平均分成三组有222
2
33
15C C C A
=种分法;要五个接收器能同时接收到信
号,则需五个接收器与信号源串联在同一个线路中,即五个接收器的一个全排列,再将排列后的第一个元素与信号源左端连接,最后一个元素与信号源右端连接,所以符合条件的连接方式共有5
5120A =种,所求的概率是1208225
15
P =
=
,所以选D.
点评:本题要求学生能够熟练运用排列组合知识解决计数问题,并进一步求得概率问题,其中隐含着平均分组问题.
例6.从某批产品中,有放回地抽取产品二次,每次随机抽取1件,假设事件A :“取出的2件产品中釳多有1件是二等品”的概率()0.96P A =. (1)求从该批产品中任取1件是二等品的概率p ;
(2)若该批产品共100件,从中任意抽取2件,求事件B :“取出的2件产品中至少有一件二等品”的概率()P B .
[考查目的]本小题主要考查相互事件、互斥事件等的概率计算,运用数学知识解决问题
信号
的能力,以及推理与运算能力.
[解答过程](1)记0A 表示事件“取出的2件产品中无二等品”,
1A 表示事件“取出的
2件产品中恰有1件二等品”.
则01A A ,互斥,且01A A A =
+,故
01()()P A P A A =+2
1
2
012()()(1)C (1)1.P A P A p p p p =+=-+-=-
于是2
0.961p
=-.
解得1
20.20.2p p ==-,(舍去)
. (2)记0B 表示事件“取出的2件产品中无二等品”,则0B B =. 若该批产品共100件,由(1)知其中二等品有1000.220
⨯=件,故2
800
2
100
C 316()C
495
P B
=
=
.
00316179()()1()1.495
495
P B P B P B ==-=-
=
例7.两部不同的长篇小说各由第一、二、三、四卷组成,每卷1本,共8本.将它们任意地排成一排,左边4本恰好都属于同一部小说的概率 是 (结果用分数表示).
[考查目的] 本题主要考查运用排列和概率知识,以及分步计数原理解决问题的能力,以及推理和运算能力.
[解答提示]从两部不同的长篇小说8本书的排列方法有88A 种,左边4本恰好都属于同一部小说的的排列方法有442442A A A 种.所以, 将符合条件的长篇小说任意地排成一排,左边4本恰好都属于同一部小说的概率是
4
4
2
442
88
135
A A A P A =
=
种.所以,填
135
.
例8.甲、乙两袋装有大小相同的红球和白球,甲袋装有2个红球,2个白球;乙袋装有2个红球,n 个白球.由甲,乙两袋中各任取2个球.
(Ⅰ)若n=3,求取到的4个球全是红球的概率;(Ⅱ)若取到的4个球中至少有2个红球的概率为4
3,求n.
[考查目的]本题主要考查排列组合、概率等基本知识,同时考察逻辑思维能力和数学应用能力.
[标准解答](错误!未找到引用源。)记“取到的4个球全是红球”为事件A .
22
22224
5
1
1
1().610
60
C C P A C
C
=
⋅
=
⋅
=
(错误!未找到引用源。)记“取到的4个球至多有1个红球”为事件B ,“取到的4个球只有1个红球”为事件1B ,“取到的4个球全是白球”为事件2B . 由题意,得31()1.4
4
P B =-
=
2
1
1
1
1
2
222
212
22242
4
2
()n n n n C C C C C C P B C C
C
C
++⋅⋅=
⋅
+
⋅
2
2;3(2)(1)
n
n n =
++
2
222224
2
()n n C C P B C
C
+=
⋅
(1);6(2)(1)
n n n n -=
++
所以,
12()()()P B P B P B =+2
2(1)3(2)(1)
6(2)(1)
n
n n n n n n -=
+
++++14
=
,
化简,得271160,n n --=解得2n =,或37
n =-
(舍去),
故
2
n =.
例9.某商场经销某商品,顾客可采用一次性付款或分期付款购买.根据以往资料统计,顾客采用一次性付款的概率是0.6,经销一件该商品,若顾客采用一次性付款,商场获得利润200元;若顾客采用分期付款,商场获得利润250元.
(Ⅰ)求3位购买该商品的顾客中至少有1位采用一次性付款的概率; (Ⅱ)求3位顾客每人购买1件该商品,商场获得利润不超过650元的概率.
[考查目的]本小题主要考查相互事件、重复试验等的概率计算,运用数学知识解决问题的能力,以及推理与运算能力.
[解答过程](Ⅰ)记A 表示事件:“3位顾客中至少1位采用一次性付款”,则A 表示事件:“3位顾客中无人采用一次性付款”.
2
()(10.6)0.0
P A =-=,
()1()10.00.936
P A P A =-=-=.
(Ⅱ)记B 表示事件:“3位顾客每人购买1件该商品,商场获得利润不超过650元”.
0B 表示事件:“购买该商品的3位顾客中无人采用分期付款”. 1B 表示事件:“购买该商品的3位顾客中恰有1位采用分期付款”.
则01B
B B =+.
3
0()0.60.216
P B ==,1213()0.60.40.432P B C =⨯⨯=.
01()()P B P B B =+01()()P B P B =+0.2160.432=+0.8
=.
例10.某公司招聘员工,指定三门考试课程,有两种考试方案. 方案一:考试三门课程,至少有两门及格为考试通过;
方案二:在三门课程中,随机选取两门,这两门都及格为考试通过.
假设某应聘者对三门指定课程考试及格的概率分别是,,a b c ,且三门课程考试是否及格相互之间没有影响.
(Ⅰ)分别求该应聘者用方案一和方案二时考试通过的概率;
(Ⅱ)试比较该应聘者在上述两种方案下考试通过的概率的大小.(说明理由)
[考查目的] 本题主要考查互斥事件有一个发生的概率和对立事件的概率,以及不等式等基本知识,同时考查逻辑思维能力和数学应用能力.
[标准解答]记该应聘者对三门指定课程考试及格的事件分别为A ,B,C , 则P (A )=a ,P (B )=b ,P (C )=c. (Ⅰ) 应聘者用方案一考试通过的概率
p 1=P (A ·B ·C )+P (A ·B ·C )+P (A ·B ·C )+P (A ·B ·C ) =a ×b ×(1-c)+(1-a)×b ×c+a ×(1-b)×c+a ×b ×c=ab+bc+ca-2abc. 应聘者用方案二考试通过的概率 p 2=3
1P (A ·B )+
3
1P (B ·C )+
3
1P (A ·C )=
3
1×(a ×b+b ×c+c ×a)=
3
1 (ab+bc+ca)
(Ⅱ) p 1- p 2= ab+bc+ca-2abc-3
1 (ab+bc+ca)=
23
( ab+bc+ca-3abc)
≥2
3
2[3()3]3
abc abc -=2
3
32()(1)0abc abc -
≥.
∴p 1≥p 2
例11.
某项选拔共有四轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰.已知某选手能正确回答第一、二、三、四轮的问题的概率分别为5
4、5
3、52、5
1,且各
轮问题能否正确回答互不影响.
(Ⅰ)求该选手进入第四轮才被淘汰的概率;
(Ⅱ)求该选手至多进入第三轮考核的概率. (注:本小题结果可用分数表示)
[考查目的]本小题主要考查相互事件、重复试验的概率计算,运用数学知识解决问题的能力,以及推理与运算能力.
[解答过程](Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(1234)i A i =,,则14()5
P A =
,
23()5
P A =
,32()5
P A =
,41()5
P A =
,
∴
该
选
手
进
入
第
四轮才
被
淘
汰
的概率
41
2
3
41
23
443
2
496
()()
()()()
55
5
5
6
2
5P P
A A A A
P A P A P A P P
=
=
=⨯⨯⨯=. (Ⅱ)该选手至多进入第三轮考核的概率
3112123()P P A A A A A A =++112123()()()()()()P A P A P A P A P A P A =++142433101555555125
=
+⨯+⨯⨯=.
考点2离散型随机变量的分布列 1.随机变量及相关概念
①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.
②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列
①离散型随机变量的分布列的概念和性质
一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,
2,……)的概率P (i
x =ξ
)=i P ,则称下表.
为随机变量ξ的概率分布,简称ξ的分布列.
由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i
P ,=
i 1,2,...;(2)++21P P (1)
②常见的离散型随机变量的分布列: (1)二项分布
n 次重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,
2,…n ,并且k
n k k n k
q
p C k P P -===)(ξ,其中n
k
≤≤0,p
q
-=1,随机变量ξ的分布列如下:
ξ
0 1 …
k
…
n
ξ
1x 2x
… i x
… P P 1 P 2
…
i P
…
P
n
n q
p C 0
1
11-n n q
p C
…
k
n k k n q
p C -
q
p C n n n
称这样随机变量ξ服从二项分布,记作)
,(~p n B ξ
,其中n 、p
为参数,并记:
)
,;(p n k b q
p C k
n k
k
n =- .
(2) 几何分布
在重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离
散型随机变量,“k
ξ
=”表示在第k 次重复试验时事件第一次发生.
随机变量ξ的概率分布为:
ξ
1 2 3
… k
… P
p
qp
2
q p
…
1
k q
p
-
…
例12.
厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.
(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;
(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.
[考查目的]本题考查相互事件、互斥事件等的概率计算,考察随机事件的分布列,数学期望等,考察运用所学知识与方法解决实际问题的能力.
[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984
P A P A =-=-=
(Ⅱ)ξ可能的取值为0,1,2.
()2
172
201360190
C P C
ξ==
=
, ()1
1
317220
511190
C C P C
ξ==
=
,
()2
3
2
20
32190
C P C ξ==
=
ξ
0 1 2
1365133012190
190
190
10
E ξ=⨯
+⨯
+⨯
=.
记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率
()1362711190
95
P P B =-=-
=.
所以商家拒收这批产品的概率为2795
.
例13.
某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为5
4、5
3、
5
2,且各轮问题能
否正确回答互不影响.
(Ⅰ)求该选手被淘汰的概率;
(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)
[考查目的]本题考查相互事件、互斥事件等的概率计算,考察随机事件的分布列,数学期望等,考察运用所学知识与方法解决实际问题的能力.
[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,则
14()5
P A =
,23()5
P A =
,32()5
P A =
,
∴该选手被淘汰的概率
112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++ 142433101555555125
=+⨯+⨯⨯=.
(Ⅱ)ξ的可能值为123,
,11(1)()5
P P A ξ===,
1212428(2)()()()5
5
25
P P A A P A P A ξ====
⨯
=
,
12124312
(3)()()()5
5
25
P P A A P A P A ξ====
⨯
=
.
P
136190
51190
3190
ξ∴的分布列为
ξ
1
2
3
P
15
825
1225
18125712352525
25
E ξ∴=⨯
+⨯
+⨯
=.
解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,则14()5
P A =
,
23()5
P A =
,32()5
P A =
.
∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-43210115
5
5
125
=-⨯⨯=.
(Ⅱ)同解法一.
考点3 离散型随机变量的期望与方差 随机变量的数学期望和方差 (1)离散型随机变量的数学期望:+
+=2211p x p x E ξ…;期望反映随机变量取值的平均水平.
⑵离散型随机变量的方差:+-+-=22
212
1)()(p E x p E x D ξξξ
…+
-+n n p E x 2
)(ξ…;
方差反映随机变量取值的稳定与波动,集中与离散的程度. ⑶基本性质:b aE b a E +=+ξξ
)(;ξ
ξD a b a D 2
)(=+.
(4)若ξ~B(n ,p),则 np
E =ξ
; D ξ =npq (这里q=1-p ) ;
如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p
E 1=
ξ,D ξ =
2
p
q 其中q=1-p.
例14.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、
η,ε和η的分布列如下:
ε 0
1 2 η 0
1
2
P
610
110
10
3
P
510
10
3
210
则比较两名工人的技术水平的高低为 .
思路启迪:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.
解答过程:工人甲生产出次品数ε的期望和方差分别为:
7
.010
3210
1110
60=⨯
+⨯
+⨯
=εE ,
1
.010
3)7.02(10
1)7.01(10
6)7.00(2
2
2
=⨯
-+⨯
-+⨯
-=εD ;
工人乙生产出次品数η的期望和方差分别为:
7
.010
2210
3110
50=⨯
+⨯
+⨯
=ηE ,6
.010
2)7.02(10
3)7.01(10
5)7.00(2
2
2
=⨯
-+⨯
-+⨯
-=η
D
由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.
小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例15.
某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为
ξ
1 2 3 4 5 P
0.4
0.2
0.2
0.1
0.1
商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.
(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ; (Ⅱ)求η的分布列及期望E η.
[考查目的] 本小题主要考查概率和离散型随机变量分布列和数学期望等知识.考查运用概率知识解决实际问题的能力.
[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”
2
()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.
(Ⅱ)η的可能取值为200元,250元,300元.
(200)(1)0.4P P ηξ====,
(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,
(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.
η的分布列为
η
200 250 300 P
0.4
0.4
0.2
2000.42500.43000.2E η=⨯+⨯+⨯240=(元)
. 小结:离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.本题考查离散型随机变量分布列和数学期望等概念,考查运用概率知识解决实际问题的能力. 例16.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是
A.70,25
B.70,50
C.70,1.04
D.65,25
解答过程:易得x 没有改变,x =70, 而s 2=481[(x 12+x 22+…+502+1002+…+x 482)-48x 2]=75, s ′2=48
1[(x 12+x 22+…+802+702+…+x 482)-48x 2]
=
48
1[(75×48+48x 2-12500+11300)-48x 2]
=75-48
1200=75-25=50.
答案:B
考点4 抽样方法与总体分布的估计 抽样方法
1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样). 3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计
由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.
总体分布:总体取值的概率分布规律通常称为总体分布.
示,几何表示就是相应的条形图.
当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.
总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无
限接近于一条光滑曲线,即总体密度曲线.
典型例题
例17.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件.那么此样本的容量n= .
解答过程:A种型号的总体是2
10,则样本容量n=10
1680
2
⨯=
.
例18.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小
组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在
第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m k
+的个位数字相同,
若6
m=,则在第7组中抽取的号码是.
解答过程:第K组的号码为(1)10
k-,(1)101
k-+,…,(1)109
k-+,当m=6时,第k组抽取的号的个位数字为m+k的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.
例19.考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 160 168 174
165 168 174 159 167 156 157 1 169 180
176 157 162 161 158 1 163 163 167 161
⑴作出频率分布表;⑵画出频率分布直方图.
思路启迪:确定组距与组数是解决“总体中的个体取不同值较多”这类问题的出发点.
解答过程:⑴最低身高为151,最高身高180,其差为180-151=29。确定组距为3,组数为
10,列表如下:
⑵频率分布直方图如下:
小结: 合理、科学地确定组距和组数,才能准确地制表及绘图,这是用样本的频率分布估计总体分布的基本功. 估计总体分布的基本功。 考点5 正态分布与线性回归 1.正态分布的概念及主要性质 (1)正态分布的概念
如果连续型随机变量ξ 的概率密度函数为
22
2)(21)(σ
μπσ
--=x e
x f ,x R ∈ 其中σ、μ为常数,
并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ). (2)期望E ξ =μ,方差2
σ
ξ=D .
(3)正态分布的性质 正态曲线具有下列性质:
①曲线在x 轴上方,并且关于直线x =μ对称.
②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.
③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.
(4)标准正态分布
当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式 ①()1()x x φφ-=-,②
()()()P a b b a ξφφ<<=-.
(6)2(,)N μσ与(0,1)N 二者联系. ① 若2
~(,)N ξμσ,则~(0,1)N ξμησ
-=
;
②若2
~(,)N ξ
μσ,则()(
)(
)b a P a b μ
μ
ξφφσ
σ
--<<=-.
2.线性回归
简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.
变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.
具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公
式为:a bx y +=ˆ.其中
,
,)
(1
2
2
1x b y a x n x
y
x n y x
b n
i i
n
i i i
⋅-=--=
∑∑==,其中y x ,分别为|i x |、|i y |的平均数.
例20.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( )
A.2Φ(1)-1
B.Φ(4)-Φ(2)
C.Φ(2)-Φ(4)
D.Φ(-4)-Φ(-2)
解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).
答案:B
例21. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52).
(1)若d =90°,则ξ<的概率为 ;
(2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01). 思路启迪:(1)要求P (ξ<)=F (),
∵ξ~N (d ,0.5)不是标准正态分布,而给出的是Φ(2),Φ(-2.327),故需转化为标准正态分布的数值.
(2)转化为标准正态分布下的数值求概率p ,再利用p ≥0.99,解d . 解答过程:(1)P (ξ<)=F ()=Φ(5
.090-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.
(2)由已知d 满足0.99≤P (ξ≥80),
即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01. ∴Φ(5.080
d
-)≤0.01=Φ(-2.327). ∴5
.080
d
-≤-2.327.
∴d ≤81.1635. 故d 至少为81.1635.
小结:(1)若ξ~N (0,1),则η=σ
μ
ξ
-~N (0,1).(2)标准正态分布的密度函数f (x )
是偶函数,x <0时,f (x )为增函数,x >0时,f (x )为减函数. 例22.设),(~2
σμN X
,且总体密度曲线的函数表达式为:4
1
22
21)(+--
=
x x e
x f π
,x ∈R.
(1)则μ,σ是 ;(2)则)2|1(|
<
-x P 及)
22121(+<<-
x P 的值是 .
思路启迪: 根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ.利用一般正态总体
),(2
σμN 与标准正态总体
N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解
决.
解答过程:⑴由于2
22
)
2(
2)1(4
1
22
2121)(--
+--
⋅
=
=
x x x e
e x
f ππ
,根据一般正态分布的函数表达形式,
可知μ=1,2=σ,故X ~N (1,2).
)
2121()2|1(|)2(+
<<-
=<
-x P x P
2121(12)(12)(
)(
)
2
2
F F φφ1+-1-
-=+--=-
(1)(1)φφ=--
2(1)120.84131φ=-=⨯-6826
.0=.
又)
21()221()22121(-
-+=+<<-
F F x P
221
21(
)(
)(2)(1)
2
2
φφφφ1+-1--=-=-- (2)(1)10.97720.84131φφ=+-=+-8185
.0=.
小结:通过本例可以看出一般正态分布与标准正态分布间的内在关联.
例23. 公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ε~N (173,7)(单位:cm ),则车门应设计的高度是 (精确到1cm )?
思路启迪:由题意可知,求的是车门的最低高度,可设其为xcm ,使其总体在不低于x 的概率小于1%.
解答过程:设该地区公共汽车车门的最低高度应设为xcm ,由题意,需使P(ε≥x)<1%. ∵ε~N (173,7),∴99
.0)7
173
(
)(>-=≤x x P φε
。查表得33
.27
173
>-x ,解得x>179.16,
即公共汽车门的高度至少应设计为180cm ,可确保99%以上的成年男子头部不跟车门顶部碰撞. 【专题训练】 一.选择题
1.下面关于离散型随机变量的期望与方差的结论错误的是 ( )
A.期望反映随机变量取值的平均水平,方差反映随机变量取值集中与离散的程度.
B.期望与方差都是一个数值,它们不随试验的结果而变化
C.方差是一个非负数
D.期望是区间[0,1]上的一个数.
2.要了解一批产品的质量,从中抽取200个产品进行检测,则这200个产品的质量是 ( ) A. 总体 B.总体的一个样本 C.个体 D. 样本容量
3.已知η的分布列为:
设23-=ηξ则ξD 的值为 ( )
A. 5
B. 3
4 C.
3
2-
D.3
-
4.设),(~p n B ξ
,12
=ξE ,4=ξ
D ,则n,p 的值分别为 (
)
A.18 ,3
1 B. 36 ,3
1 C.
3
2,36 D. 18,3
2
5.已知随机变量ξ 服从二项分布,)
3
1
,6(~B ξ,则)2(=ξP 等于 (
)
A.
16
3 B.
243
4 C.
243
13 D.
243
80
6.设随机变量的分布列为15
)(k k P =
=ξ,其中k=1,2,3,4,5,则)2
52
1
(<
<ξP 等于 ( )
A.5
1 B.
2
1 C.
9
1 D. 6
1
7.设15000件产品中有1000件废品,从中抽取150件进行检查,则查得废品数的数学期望为( )
A.15
B.10
C.5
D.都不对
8.某市在会上,要从农业、工业、教育系统的代表中抽查对工作报告的意见.为了更具有代表性,抽取应采用 ( )
A.抽签法
B.随机数表法
C.系统抽样法
D.分层抽样
9.一台X 型号的自动机床在一小时内不需要人照看的概为0.8000,有四台这种型号的自动机床各自工作,则在一小时内至多有2台机床需要工人照看的概率是 ( ) A.0.1536 B.0.1808 C.0.5632 D.0.9728
10.某校高三年级195名学生已编号为1,2,3,…195,为了解高三学生的饮食情况,要按1:5的比例抽取一个样本,若采用系统抽样方法进行抽取,其中抽取3名学生的编号可能是( ) A.3,24,33 B.31,47,147 C.133,153,193 D.102,132,159
η 1- 0 1
P 21 31 6
1
11.同时抛掷4枚均匀硬币80次,设4枚硬币正好出现2枚正面向上,2枚反面向上的次数为ξ,则ξ的数学期望是 ( ) A.20 B.25 C.30 D.40 12.已知)
,0(~2
σξ
N ,且4.0)02(=≤≤-ξp ,则P(2>ξ)等于 ( )
A.0.1
B.0.2
C.0.3
D.0.4
13.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
14.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )
2015105人数(人)时间(h)
0.5 1.0 1.5 2.0
A.0.6 h
B.0.9 h
C.1.0 h
D.1.5 h
二.填空题
15.某工厂规定:工人只要生产出一件甲级产品发奖金50元,生产出一件乙级产品发奖金30元,若生产出一件次品则扣奖金20元,某工人生产甲级品的概率为0.6,乙级品的概率为0.3,次品的概率为0.1,则此人生产一件产品的平均奖金为 元.
16. 同时抛掷两枚相同 的均匀硬币,随机变量1=ξ 表示结果中有正面向上, 0
=ξ表示结果中
没有正面向上,则=ξ
E .
17. 甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t / hm 2)
品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙
9.4
10.3
10.8
9.7
9.8
其中产量比较稳定的小麦品种是 .
18.一工厂生产了某种产品16800件,它们来自甲、乙、丙3条生产线,为检查这批产品的质量,
19.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是___________.
20.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是___________.
三.解答题
21.某单位有职工160名,其中业务人员120名,管理人员16名,后勤人员24名.为了解职工的某种情况,要从中抽取一个容量为20的样本.若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为多少?
22.甲、乙两人各进行3次射击,甲每次击中目标的概率为1
2,乙每次击中目标的概率为2
3
.求:(1)
记甲击中目标的次数为ξ,ξ的概率分布及数学期望;
(2)乙至多击中目标2次的概率;
(3)甲恰好比乙多击中目标2次的概率.
【参】
一、1.D 2. B 3.A 4.D 5. D 6. A 7. B 8. C 9. D 10. C 11. C 12 A 13. 提示:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.
依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.
答案:B
14.提示:
50
5.0
20
)5.1
1(
10
2
5⨯
+
+
⨯
+
⨯=0.9. 答案:B
二. 15. 37 ; 16.
4
3 ; 17.甲 ; 18.5600;
19. 提示:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.
∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:63
20.提示:不妨设在第1组中随机抽到的号码为x ,则在第16组中应抽出的号码为120+x . 设第1组抽出的号码为x ,则第16组应抽出的号码是8×15+x =126,∴x =6. 答案:6
三.21.解 :分层抽样应按各层所占的比例从总体中抽取. ∵120∶16∶24=15∶2∶3,又共抽出20人, ∴各层抽取人数分别为20×20
15=15人,20×
20
2=2人,20×
20
3=3人.
答案:15人、2人、3人. 22. 解:(1)
18
P ξ=03
3
1(=0)=C ()2 ;
38
P ξ=13
3
1(=1)=C ()2 ;
38
P ξ=23
3
1(=2)=C ()2;
18
P ξ=333
1(=3)=C ()2.
ξ的概率分布如下表 ξ
1
2
3
P
18
38
38
18
13310123 1.5.88
88E ξ=⨯
+⨯
+⨯
+⨯
=
(2)乙至多击中目标2次的概率为33
19127
C -=32()3
.
(3)设甲恰好比乙多击中目标2次为事件A ,甲恰击中2次且乙恰击中目标0次为事件B 1,甲恰击中目标3次且乙恰击中目标1次为事件为B 2, 则12A B B =
+,1B 、2B 为互斥事件.112127
24
P ⨯+⨯=123(A )=P (B )+P (B )=
8.
所以甲恰好比乙多击中目标2次的概率为124