思考与练习
第一章
1.1判断题:
(1)错 、(2)错、(3)错、(4)对、(5)错、(6)错、(7)错、(8)对
1.2 答:民族是定类尺度数据;教育程度是定序尺度数据;人口数、信教人数、进出口总额是定距尺度数据;经济增长率是定比尺度数据。
1.3选择题:
(1)社会经济统计学的研究对象是:
A.
(2)属于不变标志的有:( A )
属于数量标志的有:( B、C )
(3)A
1答:例如考察全国人口的情况,全国所有的人为统计总体,而每个人就是总体单位。每个人都有许多属性和特征,比如民族、性别、文化程度、年龄、身高、体重等,这些就是标志。其中,性别、民族和文化程度是品质标志,年龄、身高、体重等则是数量标志;而指标是说明统计总体数量特征的,用以说明全国人口的规模如人口总数等指标就是数量指标,而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标,质量指标通常是在数量指标的派生指标。
1.5(略)
第二章
2.1:(略)
2.2:(1)B (2)D (3)C
2.3:
按收入分组 | 累计百分数 | ||
(元) | 居民户数 | 月收入 | 金融资产 |
500以下 | 4.7 | 1.1 | 0.7 |
500~1000 | 14.1 | 4.3 | 3 |
1000~1500 | 34.4 | 17.2 | 11.5 |
1500~2500 | 67.2 | 48.7 | 39.3 |
2500~3500 | 90.6 | 82.1 | 77.9 |
3500以上 | 100 | 100 | 100 |
2.4解.:
按完成个人生产定额(%)分组 | 频数 (人) | 频率 (%) | 下限 | 上限 | 向上累计 | 向下累计 | ||
频数 (人) | 频率 (%) | 频数 (人) | 频率 (%) | |||||
80~90 90~100 100~110 110~120 120~130 130~140 140~150 150~160 | 2 3 10 11 8 3 2 1 | 5 7.5 25 27.5 20 7.5 5 2.5 | 80 90 100 110 120 130 140 50 | 90 100 110 120 130 140 150 160 | 2 5 15 26 34 37 39 40 | 5 12.5 37.5 65 5 92.5 97.5 100 | 40 38 35 25 14 6 3 1 | 100 95 87.5 62.5 35 15 7.5 2.5 |
合 计 | 40 | 100 | — | — | — | — | — | — |
茎 | 叶 | ||||||||||
8 9 10 11 12 13 14 15 | 7 2 0 0 0 6 2 8 | 8 5 3 2 3 7 6 | 7 3 3 4 8 | 4 4 5 | 5 5 6 | 5 5 7 | 7 7 7 | 7 7 9 | 8 8 | 8 9 | 9 |
由上图可以看出,工人完成个人生产定额属于钟形分布。
累计曲线图:
第三章
3.1(略)
3.2 (1)B;(2)B、C;(3)A、C;;(4)C。
3.3 13.7元/件
3.4解:
3.5
解:(1)平均利率=
存款额=
(2)平均利率=
存款额=
3.6解: 0.5275
0.7263
3.7:偏度;峰度
3.8解: ;甲品种更有推广价值。
3.9:(1)平均为24.71厘米;(2)众数24.86厘米,中位数24.96厘米;(3)极差24厘米,平均差4.45厘米,标准差5.42厘米。
3.10解: 优秀率
合格率
第四章
4.1(1)C;(2)A;(3)C;(4)C
4.2(1)A、B、C、D
(2)A、B、C、E
(3)A、B、C、E
4.3(1)pr.=0.3;(2) pr.= 0.466667
4.4 pr.= 0.872
4.5(1) pr.=0.19705;(2)pr.=0.00035
4.6设三个车间分别记为A1、A2、A3,是次品记为B。
则有:
p(A1)=25% P(B|A1)=5% p(A1|B)=0.362319
p(A2)=35% p(B|A2)=4% p(A2|B)=0.405797
p(A3)=40% p(B|A3)=2% p(A3|B)=0.231884
与p(A1|B)、p(A3|B)比,p(A2|B)最大,来自乙车间的可能性最大。
第五章
5.1 (1)ABCDE;(2)ABDE;(3)C; (4)B
5.2答:因为类型抽样的样本平均数标准差与组间方差无关,决定于组内方差的平均水平;整群抽样的样本平均数标准差与组内方差无关,决定于组间方差大小。所以类型抽样在分组时应尽量提高组间方差,降低组内方差,具体来说,就是使类型抽样的各部分内部单位差异尽可能地小,不同类型间的差异尽可能地大。而整群抽样在分组时为了降低样本平均数标准差,应该设法降低群间方差,可通过提高群内方差方法达到降低群间方差目的。因此,类型抽样与整群抽样对总体进行分组的要求刚好是相反的。
5.3 由于,样本均值的期望与总值差异为0,样本平均数是总体均值的无偏估计。样本平均数的标准差反映这个无偏估计量本身的波动程度,这个标准差越小,估计量的代表性越强,产生较大偏误的可能性越小;标准差越大,估计量的代表性越差,产生较大偏误的可能性越大。因此,抽样平均数的标准差从整体上反映估计的误差大小,成为该抽样的误差指标。从这个意义上我们建立起平均数与总体均值的内在联系,应用中就是利用样本平均数估计总体平均数的这种内在联系,通过样本平均数去估计总体平均数。
5.4答:
5.5设这家灯泡制造商的灯泡的寿命为x,则。
从而:,不再购买意味着样本平均数小于等于680小时。所求概率Pr. =
=0.02275
第六章
6.1 (1) D;(2) A ;(3) B ; (4) B
6.2(1)A、C、D、E
(2)A、C、E
(3)A、B、C
6.3
(1) N=1500,n=50,样本平均数=560,样本标准差=32.77629806。
由于总体标准差未知,可使用样本标准差替代。则重复抽样标准差 :
。
(2) 由题意得,=2,月平均工资。
所以=[494.45, 625.55 ]
6.4
(1)已知=4小时,n=100,σ=1.5小时,α=5%。
由于样本容量在地区居民人数中所占的比重太小,重复与不重复抽样效果相差不大,按重复抽样计算,区间估计是:
因此,95%置信度估计该地区内居民每天看电视的平均时间在3.71到4.29个小时之间。
(2)要求极限误差等于27分钟,即Δ=0.45小时。这时概率度 :
查表知置信度=99.73%
6.5
合格品率:P=190/200100%=95%
抽样平均误差:=0.015
(2)
(3)
6.6
(1)学生身高的区间估计[169,175.1](cm)
(2) 学生身高的区间估计[169.28,175.38](cm)
第七章
7.1(1) B ; (2) B; (3) C; (4) C
7.2(1)A、B、D
(2) A、C、D、E
7.3
(双侧检验)。
检验统计量。
查出=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。
。因为<2.131<2.947,所以在两个水平下都接受原假设。
7.4
假设检验为 (右侧检验)。
n=100可近似采用正态分布的检验统计量。查出=0.01水平下的反查正态概率表得到临界值2.34到2.36之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值。因为z=3>2.36(>2.34),所以拒绝原假设,认为彩电无故障时间有显著增加。
7.5
(1) (右侧检验)。
,s=450,n=50>30,作大样本处理,检验统计量。=0.05,=1.65。计算统计量值=1.571348。因为z<,所以样本没有显示新生儿体重有显著增加。
(2)p值=1-P(z< 1.571348)=1-0.941949=0.05805>=0.05.
接受原假设,样本证据显示新生儿体重没有显著增加。
7.6
当为真时,选择检验统计量
查表,
因此,在0.05的显著性水平下,可以拒绝原假设,认为平均加油量并非12加仑。
(2)计算(1)的p-值。
解答:检验的p值为
由于,所以拒绝原假设。
(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?
解答:
p=0.19
当为真时,选择为统计量趋近于标准正态;
查表,在显著性水平为0.05的情况下,
因此,在显著性水平为0.05的情况下,不能拒绝原假设,没有证据说明少于20%的驾车者购买无铅汽油。
(4)计算(3)的p-值。
解答:检验的p值为0.4
由于,所以不能拒绝原假设。
(5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2)。
解答:
当为真时,选择检验统计量
查表,
因此,在0.05的显著性水平下,可以拒绝原假设,认为平均加油量并非12加仑。
并且,检验的p值为
由于,所以拒绝原假设。
7.7
解:假设检验为。采用成数检验统计量。查出=0.05水平下的临界值为1.和1.65之间。计算统计量值, z=-0.577>-1.,所以接受原假设。单侧检验的p值为0.48和0.476之间。显然p值>0.05,所以接受原假设。
7.8
解:
,
7.9
解:
南段 | 28 | 20 | 4 | 32 | 8 | 12 | 16 | 48 | 8 | 20 |
北段 | 20 | 11 | 13 | 10 | 45 | 15 | 11 | 13 | 25 | 8 |
差值符号 | + | + | - | + | - | - | + | + | - | + |
7.10
解: 将样本混合排序,有:
A | B | 秩A | 秩B |
13 | 1 | ||
17 | 2 | ||
18 | 3 | ||
20 | 4 | ||
22 | 5 | ||
24 | 6 | ||
25 | 7.5 | ||
25 | 7.5 | ||
27 | 9 | ||
30 | 10.5 | ||
30 | 10.5 | ||
33 | 12 | ||
34 | 13 | ||
35 | 14 | ||
36 | 15 | ||
37 | 16 | ||
38 | 17 | ||
39 | 18 | ||
40 | 19 |
41 | 20 | ||
42 | 21 | ||
44 | 22 | ||
46 | 23 | ||
47 | 24 | ||
48 | 25 | ||
50 | 26 | ||
53 | 27 | ||
54 | 28 |
H0:无显著差异; H1:有显著差异 | |
取A为总体I,B为总体II,n1=n2=14 | |
总体I的秩和T= | 246 |
alpha= | 0.05 |
n=n1+n2= | 28 |
T平均=n1*(n+1)/2= | 203 |
标准差= | 21.76388 |
Z统计量= | 1.97575 |
临界值= | 1.96 |
p值= | 0.048183 |
7.11
解: 因为A (8个),AA(4个),AAA(2个),AAAAA(1个),B(7个),BB(6个),BBBB(1个)。n1=27,n2=23。假设检验H0:样本为随机样本,H1:样本为非随机样本。求出游程总和。R1=15,R2=14,R=29。
因为,
构造统计量。
由于=0.05的临界值为1.96, z=0.909<1.96,所以接受原假设。
7.12
解::,:;
检验统计量是:
F= 5.285714,相应2.257412。拒绝,认为两总体方差差异显著。资深人员的作用相对稳定,管理人员存在较大差别(结合所了解资料进一步阐述)。
7.13
解::性别与偏好不相关;:性别与偏好相关。
=6.12,p-值= 0.04683<0.05。拒绝原假设,认为性别与偏好相关。
第八章
8.1(1)D、(2)B、(3)A
8.2(1)A、B、C、D、E
(2)A、B、C、D
8.3 离差平方和分解是:SST=SSA+SSB+SSAB+SSE。
相对应于SST、SSA、SSB、SSAB和SSE的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。
8.4
解:方差分析表:
由于P值=0.008819<0.05,所以肥料对农作物的收获量有显著的作用。
8.5
方差分析表:
由于p值=0.11949>0.05,所以品种检验对产量没有显著影响。
8.6方差分析表:
由于行(地区)因素的p值=0.241868>0.05,所以地区对销售量也没有显著影响。同理,列(包装)因素的p值=0.31943>0.05,所以,包装对销售量没有显著影响。
8.7
上表中列是工人,行是设备。从P-value可知,无论是工人还是设备对产量都没有显著影响。
第九章
9.1
(1)BCD;(2)C;(3)C;(4)ABD
9.2 证明:
教材中已经证明是现行无偏估计量。此处只要证明它在线性无偏估计量中具有最小方差。设为的任意线性无偏估计量。
也即,作为的任意线性无偏估计量,必须满足下列约束条件:
;且
又因为,所以:
分析此式:由于第二项是常数,所以只能通过第一项的处理使之最小化。明显,只有当 时,才可以取最小值,即:
所以,是总体回归系数的最优线性无偏估计量.
9.3 解:
(1)
因此,,其中,0.7863为边际成本,表示销售收入每增加一个单位,销售成本平均增加0.7863单位。40.3720为固定销售成本,表示当没有销售收入的情况下仍要花费的销售成本。
(2)
又,可得
回归误差标准差
(3)
查t分布表可知:显著水平为5%,自由度为10的双侧t检验的临界值是2.228。以上计算的t值远远大于此临界值,所以拒绝原假设,接受备择假设,即认为销售收入对销售成本的影响是非常显著的。
(4)把=800代入模型,得
(万元)
=
=2.2282
查t分布表可知:显著水平为5%,自由度为10的双侧t检验的临界值是2.228。因此,当销售收入为800万元时,置信度为95 %的销售成本的预测区间如下:
669.41-2.228×2.2282≤Yf≤669.41+2.228×2.2282
即6.45(万元)≤Yf≤674.37(万元)
9.4 解:
(1) ,
Y=0.0727+0.0273x
0.071996
(3) 相关系数
t= 15.7044≥2.365
所以,拒绝原假设。可以得出身高与体重存在显著相关关系的结论。
(4)
=
≥2.365
所以,拒绝原假设。根据样本,可判断体重与身高有显著关系。
第十章
10.1
(1)C;(2)A;(3)C;(4)ABD
10.2解
(1),
人均销售额越大,企业利润越高,故此商业利润率越高,从而商业利润率与人均销售额呈正相关关系;而流通费用率越高,反映商业企业的经营成本越高,其商业利润率就越低。
(2),
人口数量越多,对粮食的消费量就越大;人均收入越多,对粮食的购买力就越强,故此这两个变量皆与粮食销售量呈正相关关系。
(3),
固定资产和职工人数是两大生产要素,数量越多,说明生产要素越密集,工业总产值就越高,所以它们与工业总产值的关系为正相关。
(4),,
因为国内生产总值包括三次产业,所以工业总产值、农业总产值和全部的国内生产总值为正相关关系,同时即便某些特殊地区没有工业和农业,仍然有国内生产总值,所以,。
10.3解
步骤一:构建excel工作表
步骤二:回归分析
选择“工具” →“数据分析”,再在“数据分析”菜单中选中“回归”:
在“回归”窗口中确定因变量Y值和自变量X值的区域后,点击“确定”。
回归结果:
从计算结果可知,拟合的样本回归方程为:
(2) 由上表可知,回归估计的标准误差为379.5272,修正自由度的决定系数为0.9623,另外,回归方程的5%显著性检验,如下:
首先,假设总体回归方程不显著,即有
H0:β1=β2=β3=0
接着,求F统计量,
F===141.5626
最后查F分布表,可知自由度为(2,8)和显著水平0.05的理论临界值Fa为4.46,因此F>Fa,拒绝原假设,即认为总体回归函数中各自变量的线性回归关系显著。
(3)预测
点估计:X1=12000元,X2=40000元代入回归方程,得到Y=9672.4315元
利用多元线性回归模型预测误差的矩阵公式和区间预测公式可求得:
预测方差=379.5272×1.1820=448.6187
置信度为95%的预测区间(已知t0.025(9)=2.262):
9672.4315-t0.025(9)×448.6187≦yf≦9672.4315+t0.025(9)×448.6187
即 ≦yf≦10687.207
本题通过SPSS也可实现同样的计算。
10.4解
(1)拟合成本函数
步骤一:创建EXCEL工作表
步骤二:回归分析:
回归结果:
从计算结果可知,拟合的样本回归方程为:
t= (0.0478) (2.2815) (-0.4316) (2.4241)
2=0.9994
(2)根据总成本函数可以推导出平均成本函数为:
平均成本函数图形如下:
、
(3)当总产量为1550时,单位产品的平均成本=140.0867
第十一章
11.1(1) A、B、D;
(2)A、B、C、E
(3)A、B、C、D 、
(4)B、C、D
(5)B、D、E
11.2
解:①填写表中空格,结果用斜体表示。
月 份 | 1 | 2 | 3 | 4 |
月初职工人数(人) 月总产值(万元) 月平均人数(人) 月劳动生产率(元/人) | 250 27.825 265 1050 | 无资料 26.500 265 1000 | 280 29.150 275 1060 | 270 — — — |
③第一季度工业总产值 = 27.825 + 26.500 + 29.150 = 83.475(万元)
第一季度平均每月工业总产值 ==27.825(万元)
④第一季度劳动生产率 ==3110.91(元/人)
第一季度平均月劳动生产率 = ==1036.97(元/人)
11.3
解:每年应递增:=118.%
以后3年中平均每年应递增:=114.88%
11.4
解:第一步:计算十二个月的移动平均修匀值,由于移动项数为偶数项,需进行二次移动平均,结果见下表。十二个移动平均的结果消除了季节变动和随机变动的影响,所得各月的二次移动平均值为趋势变动和循环变动综合作用的结果,即。
第二步:剔除趋势变动与循环变动的影响。用各月的实际值分别除以各月的移动平均修匀值,则得到季节变动与随机变动共同作用的结果,即
。
二次移动平均值结果表
月份 | |||||
2000 | 2001 | 2002 | 2003 | 2004 | |
1 | — | 72.92 | 114.42 | 145.46 | 165.63 |
2 | — | 73.42 | 116.09 | 146.00 | 1.17 |
3 | — | 74.38 | 118.38 | 146.88 | 162.75 |
4 | — | 76.46 | 122.54 | 147.00 | 163.67 |
5 | — | 83.33 | 128.59 | 148.67 | 1.50 |
6 | — | 92.92 | 137.34 | 152.00 | 1.50 |
7 | 63.75 | 100.83 | 144.42 | 155.96 | — |
8 | 67.92 | 107.08 | 145.67 | 161.59 | — |
9 | 70.00 | 110.42 | 146.09 | 1.92 | — |
10 | 71.46 | 111.88 | 146.50 | 165.96 | — |
11 | 72.25 | 112.92 | 145.75 | 166.50 | — |
12 | 72.59 | 113.46 | 145.34 | 166.42 | — |
第二步、第三步的相应计算结果见下表。
如1月份的季节指数:S=(205.7%+209.75%+192.49%+208.3%)/4=204.24%;
7月份的季节指数:S=(12.55%+11.9%+22.16%+23.72%)/4=17.59%。
月份 | (%) | 季节指数S(%) | ||||
1990 | 1991 | 1992 | 1993 | 1994 | ||
1 | — | 205.70 | 209.75 | 192.49 | 208.30 | 204.24 |
2 | — | 122.58 | 129.21 | 95. | 127.92 | 119.00 |
3 | — | 53.78 | 50.68 | 54.47 | 55.30 | 53.60 |
4 | — | 32.70 | 32. | 20.41 | 27.49 | 28.33 |
5 | — | 12.00 | 15.55 | 8.07 | 6.08 | 10.44 |
6 | — | 8.61 | 8.01 | 5.92 | 5.47 | 7.00 |
7 | 12.55 | 11.90 | 22.16 | 23.72 | — | 17.59 |
8 | 17.67 | 18.68 | 27.46 | 29.70 | — | 23.40 |
9 | 28.57 | 31.70 | 47.92 | 50.33 | — | 39.66 |
10 | 69.97 | 75.97 | 102.39 | 84.36 | — | 83.24 |
11 | 290.66 | 301.10 | 288.16 | 282.28 | — | 290.81 |
12 | 344.40 | 308.48 | 330.26 | 306.45 | — | 322.69 |
11.5
解:由于数据的波动幅度较大,因而先分别采用三项加权移动平均和平滑系数为0.9的指数平滑法对各期数据进行预测。
①取N=3,,根据公式
可计算各期的加权移动平均预测值见表中第4栏斜体部分。
则2002年的加权移动平均预测值为
②用指数平滑法计算各期的预测值,取,则
取平滑初始值,则可计算各期的平滑预测值,
1984年的预测值:
1985年的预测值:
同理可得1986-2001年各年的指数平滑预测值,见表中最后一栏斜体部分。则2002年的指数平滑预测值:
实际上2002年全社会铁路客运量为105606万人,用指数平滑法预测的相对误差仅为0.49%,预测效果优于加权移动平均预测法.
第十二章
12.1:(1)C;(2)B;(3)A;(4)C
12.2.:(1)
(2)
12.3:用加权算术平均数指数102.9%,用加权调合平均数指数102.36%,
12.4:=110.28%
12.5:(1)40亿元;(2)7.84%,31.37亿元(3)8.63亿元
12.6:(1)135.95%;307000元
(2)
307000=190000+117000
12.7:106.25%
12.8:101.2%
12.9:(1)4.7%;(2)用加权算术平均数指数156.02%,加权调和平均数指数141.09%
12.10:(1)i技=106.25%;i普=112.5%
(2)110.36%
(3)
110.36%=101.43%×108.80%
11.6=1.6+10
(4)略
(5)11.6×1500=1.6×1500+10×1500
即17400=2400+15000
12.11:解:
指 标 | 权数 | 功效系数 | ||
甲地区 | 乙地区 | 丙地区 | ||
主要工业产品质量稳定提高率(%) | 20 | 80 | 88 | 68 |
百元总产值利税额(元) | 30 | 80 | 86 | 56 |
可比产品成本降低率(%) | 10 | 84 | 76 | 52 |
全员劳动生产率(元/人) | 20 | 76 | 88 | |
每万元产能消耗(吨) | 20 | 54 | 77 | 84 |
综 合 指 数 | — | 74.4 | 84 | 65.5 |
排 名 | — | 2 | 1 | 3 |
13.1解
(1)ABCD (2)CD (3)B (4)B
13.2解
(1)根据最大的最大收益值准则,应该选择方案一。
(2)根据最大的最小收益值准则,应该选择方案三。
(3)在市场需求大的情况下,采用方案一可获得最大收益,故有:
在市场需求中的情况下,采用方案二可获得最大收益,故有:
在市场需求小的情况下,采用方案三可获得最大收益,故有:
根据后悔值计算公式,可以求得其决策问题的后悔矩阵,如下表:
后悔矩阵表
状态 | 需求大 | 需求中 | 需求小 | |
方案 | 方案一 | 0 | 100 | 140 |
方案二 | 200 | 0 | 20 | |
方案三 | 400 | 200 | 0 |
(4)
由于在所有可选择的方案中,方案一的期望收益值最大,所以根据折中原则,应该选择方案一
(5)
因为方案二的期望收益值最大,所以按等可能性准则,应选择方案二。
综上,最后结果如下表:
所依据的准则 | 选择的方案 |
最大的最大收益值准则 | 方案一 |
最大的最小收益值准则 | 方案三 |
最小的最大后悔值准则 | 方案一 |
折衷准则( | 方案一 |
等可能性准则 | 方案二 |
(1)方案一:期望E(a1)=150 变异系数V1=0.5033,
方案二:期望E(a2)=140 变异系数V2=0.4124,
方案三:期望E(a3)=96 变异系数V3=0.1443,
所以,根据期望值准则,选择方案一;根据变异系数准则,选择方案三。
(2)该企业宜采用满意准则,选择方案二。
(3)该企业宜采用最大可能准则,选择方案三。
13.4解
设由于飞机自身结构有缺陷造成的航空事故为,由于其它原因造成的航空事故为,被判定属于结构缺陷造成的航空事故为,则根据已知的条件有:
=0.35, =0.65, =0.80, =0.30
当某次航空事故被判断为结构缺陷引起的事故时,该事故确实属于结构缺陷的概率为:
该事故确实属于结构缺陷的概率是0.5517。
13.5解
汽车被盗的司机将汽车钥匙留在车内的概率是0.5556。
13.6
(1) 根据现有信息,生产的期望收益值为41.5万元,大于不生产的期望收益值,应选择生产该产品。
(2) 如果采用自行调查方案,
a.得出受欢迎的概率=0.65×0.7+0.35×0.3=0.56,
市场受欢迎的后验概率=0.65×0.7/0.56=0.8125,
生产的期望收益=80×0.8125-30×0.1875=59.375万元;
b.得出不受欢迎的概率=0.65×0.3+0.35×0.7=0.44,
市场受欢迎的后验概率=0.65×0.3/0.44=0.4432,
生产的期望收益=80×0.4432-30×0.5568=18.75万元(尽管预报不受欢迎,但生产的预期收益仍大于0即不生产情况)。
c.因此,如果采用自行调查,其后验分析最佳方案的期望收益=0.56×59.375+0.44×18.75-3=38.5万元,小于先验分析最佳方案的期望收益41.5万元,所以不宜采取此方案。
(3) 如果采用委托调查,
a.得出受欢迎的概率=0.65×0.95+0.35×0.05=0.635,
市场受欢迎的后验概率=0.65×0.95/0.635=0.9724,
生产的期望收益=80×0.9724-30×0.0276=76.9685万元;
b.得出不受欢迎的概率=0.65×0.05+0.35×0.95=0.365,
市场受欢迎的后验概率=0.65×0.05/0.365=0.0,
选择生产的期望收益=80×0.0-30×0.911=-20.2055万元(选择不生产)。
c.因此,如果采用委托调查,其后验分析最佳方案的期望收益=0.635×76.9685+0.365×0-5=43.872万元,大于先验分析最佳方案的期望收益41.5万元,所以应该采用此方案。
第十四章
14.1(1)C;(2)A; (3) B;(4)D
14.2(1)A、B、C
(2)A、B、C、D、E
(3) A、B
14.3
通过SPSS的分层聚类法,比较各种方法与实际情况的关系,选择Ward法较好。聚类过程表与树状图如下:
第一组:北京、浙江、上海;
第二组:吉林、安徽、江西、福建、辽宁、江苏、天津;
第三组:其它省。
14.4
解:结果总结如下表:
地区 | 聚类结果 | 判别分析归类 | 待判样品归类 |
北京 | 2 | 2 | |
天津 | 3 | 3 | |
河北 | 3 | 3 | |
山西 | 3 | 3 | |
内蒙 | 3 | 3 | |
辽宁 | 3 | 3 | |
吉林 | 3 | 3 | |
黑龙江 | 3 | 3 | |
上海 | 1 | 1 | |
江苏 | 2 | 2 | |
浙江 | 2 | 2 | |
安徽 | 3 | 3 | |
福建 | 3 | 3 | |
江西 | 3 | 3 | |
山东 | 3 | 3 | |
河南 | 3 | 3 | |
湖北 | 3 | ||
湖南 | 2 | ||
广东 | 3 |
广西 | 3 |
15.1(1)B;(2)D
15.2(1)A、C、D、E
(2)A、B、C、E
(3)A、B、D、E
15.3
解:设X1=资产总计,X2=固定资产净值平均余额,X3=产品销售收入,X4=利润总额。
通过SPSS计算特征根和累计贡献率、特征向量:
特征根和累计贡献率
序号 | 特征根 | 方差贡献率(%) | 累计贡献率(%) |
1 | 3.609 | 90.220 | 90.220 |
2 | .388 | 9.709 | 99.929 |
3 | .003 | .0 | 99.993 |
4 | .000 | .007 | 100.000 |
Y1=0.50X1+0.53X2+0.52X3+0.45X4
Y2=-0.49X1-0.02X2-0.23X3+0.84X4
行业名称 | 因子一得分 | 因子二得分 | 综合得分 | 排序 |
煤炭开采和选业 | 0.9859 | -1.77602 | 0.717793 | 2 |
石油和天然气开采业 | 1.54635 | 1.32925 | 1.525275 | 1 |
黑色金属矿采选业 | -0.5821 | 0.05717 | -0.52004 | 4 |
有色金属矿采选业 | -0.55982 | 0.15162 | -0.49076 | 3 |
非金属矿采选业 | -0.60016 | 0.00886 | -0.54104 | 5 |
其它采矿业 | -0.79017 | 0.22912 | -0.69122 | 6 |
通过SPSS计算结果如下:
(1)特征根和累计贡献率
因子 | 特征根 | 方差贡献率% | 累计贡献率% |
1 | 3.2383 | 53.9720 | 53.9720 |
2 | 1.2773 | 21.2882 | 75.2601 |
3 | 0.6808 | 11.34 | 86.6066 |
4 | 0.4580 | 7.6339 | 94.2404 |
5 | 0.2116 | 3.52 | 97.7668 |
6 | 0.1340 | 2.2332 | 100.0000 |
变量 | 因子一 | 因子二 |
数学 | -0.2447 | 0.7951 |
物理 | -0.1515 | 0.6976 |
化学 | -0.0985 | 0.8148 |
语文 | 0.8673 | -0.3352 |
历史 | 0.9043 | -0.2093 |
英语 | 0.9535 | -0.0718 |
从计算结果可以看出,提取两个因子累计方差贡献达到75%。第一个因子在语文、历史和英语三科上的载荷大,是“文科因子”,因子二在数学、物理和化学上的载荷大,是“理科因子”。可通过各个学生在文科和理科因子上的得分并排序,分析他们分别适合哪一科的学习。