
1、下表为某企业2005年~2009年5年中各季度计划完成和实际完成的产量(单位:万吨)数据资料,试建立SPSS数据文件并计算按季度、按年份汇总的计划和实际完成的总产量与平均产量。
| " 年份 | 一季度 | 二季度 | 三季度 | 四季度 | ||||
| 计划数 | 实际数 | 计划数 | 实际数 | 计划数 | 实际数 | 计划数 | 实际数 | |
| 2005 2006 2007 2008 2009 | 14 17 16 18 20 | 12.5 17.2 16.5 18.4 20.5 | 18 18 20 20 21 | 21.4 19.8 16.8 19.2 25.8 | 18 17 18 20 25 | 18.5 19.2 17.7 20.5 22.5 | 20 20 21 22 25 | 20.4 22.5 19.6 20.8 24.5 |
| id | 甲村 | id | 乙村 | ||
| 中麦9号 | 豫展1号 | 中麦9号 | 豫展1号 | ||
| 1 2 3 4 5 | 43.11 42.15 37.59 38.23 40.19 | 48.91 45.63 41.59 44.23 37.43 | 6 7 8 9 10 | 43.87 36.71 43.59 40.83 42.51 | 44.75 45.67 43.15 46.71 39.55 |
| 编号 | 部门 | 所有制类型 | 年产值(万元) | 职工人数(人) | 年工资总额(万元) |
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | 工业 交通 商业 交通 工业 工业 邮电通讯 商业 交通 工业 工业 交通 工业 工业 商业 邮电通讯 工业 工业 商业 交通 | 国有 国有 集体 个体 集体 国有 国有 个体 个体 国有 集体 个体 国有 集体 股份制 国有 国有 股份制 国有 国有 | 2805.58 1265.40 256.50 26.88 560.00 800.50 2580.98 125.45 590.60 950.00 1556.00 950.00 335.00 2455.08 1780.58 2500.00 775.00 3305.00 498.08 965.58 | 1235 605 105 20 223 568 0 65 148 325 485 354 105 680 6 485 354 1015 202 246 | 812.63 435.60 68.58 14.00 156.07 256.74 854.40 65.16 130.24 268.13 394.20 257.90 82.43 639.20 471.25 486.98 272.58 912.00 139.20 159.95 |
(1)许多SPSS文件中都定义一个表示观测量序号的变量,按照自己的体会指出这个变量的作用。
(2)分别对年产值、职工人数和年工资总额进行排序。先按年产值升序,同时按职工人数降序进行排序。
(3)按部门对年工作总额作汇总(均值、标准差、最大值)。
(4)首先调用拆分文件命令分别按所有制类型将文件分组,再重复(3)的操作,比较二者的差异。
4、调查100名健康女大学生的血清总蛋白含量(g %)如下表,试作频数分析。
| 7.43 | 7.88 | 6.88 | 7.80 | 7.04 | 8.05 | 6.97 | 7.12 | 7.27 | 6.88 |
| 7.20 | 7.43 | 7.12 | 7.20 | 7.50 | 7.35 | 7.88 | 7.43 | 7.03 | 7.95 |
| 7.20 | 6.43 | 7.58 | 8.03 | 6.97 | 7.43 | 7.35 | 7.35 | 7.50 | 7.72 |
| 7.04 | 6.80 | 7.04 | 7.20 | 7.65 | 7.43 | 7.65 | 7.76 | 7.04 | 6.73 |
| 6.50 | 7.65 | 8.16 | 7.54 | 7.27 | 7.27 | 6.72 | 7.65 | 7.43 | 7.04 |
| 7.58 | 7.35 | 7.50 | 7.27 | 7.35 | 7.35 | 7.27 | 8.16 | 7.65 | 6.73 |
| 7.35 | 8.05 | 7.95 | 7.56 | 7.50 | 7.88 | 7.20 | 7.20 | 7.72 | 7.65 |
| 7.58 | 6.50 | 7.43 | 7.12 | 6.97 | 6.80 | 7.35 | 7.50 | 7.35 | 6.73 |
| 7.58 | 7.58 | 6.88 | 7.65 | 7.04 | 7.12 | 8.12 | 7.50 | 7.04 | 7.27 |
| 6.73 | 7.20 | 7.50 | 7.43 | 7.35 | 7.95 | 7.35 | 7.47 | 7.27 | 8.43 |
Stem-and-Leaf Plot
Frequency Stem & Leaf
4.00 41 . 5566
5.00 42 . 23344
6.00 43 . 556668
8.00 44 . 02455688
4.00 45 . 1458
.00 46 .
3.00 47 . 356
1.00 Extremes (>=8850)
Stem width: 100.00
Each leaf: 1 case(s)
(1)根据茎叶图列出这31个人的年工资额,定义变量建立数据文件,并计算年工资的Z得分;
(2)建立记录工资的数据文件,输出该公司职工工资的描述性统计表。指出全厂职工年工资的均值、标准差、95%置信区间等。
6、试根据某个班级会计、统计、管理3门功课考试成绩的箱图(下图)回答下列问题:
(1)估计该班各科考试成绩的中位数。
(2)估计管理成绩的内四分位数界。
(3)从会计成绩的奇异值的位置估计该学生的会计成绩。
(4)哪一门功课成绩的变异程度最大?哪一门成绩的变异程度最小?
7、试将数据文件“元件的样本电阻”中3批元件样本电阻的测量数据合并,作为同一个变量“Ohm”的观察值,定义变量“batch”(批次)标记各元件所属的批次,建立数据文件,使用样本T检验过程,两两比较各批次样本的测量电阻均值之间的差异。
8、对下列试验进行检验,指出哪个试验应该使用样本检验,哪个应该使用配对样本检验?
(1)让一组测试者一一自报自己的体重,然后测量他们的体重,得到两组数据。检验自报体重与实际体重之间的差异。
(2)对人造纤维在60°和80°的水中分别作试验,检验温度对人造纤维缩水率的影响。
(3)从一批产品中抽取部分产品,交由两名检验人员分别测量产品的某项性能指标。检验两人的测量结果是否存在差异。
(4)某商场分别询问了素不相识的20位男性顾客和20位女性顾客,了解他们对想要购买的电冰箱容量的要求,检验男性和女性顾客对电冰箱容量要求的差异。
9、某日从两台机器加工的同一种零件中分别抽取10个和9个样品,测量其尺寸(单位:cm):
甲机器:6.25, 5.78, 6.45, 6.00, 5.88, 5.76, 6.00, 5.85, 5.94, 5.79
乙机器:6.08, 6.25, 5.94, 5.94, 5.79, 6.03, 5.85, 6.10, 5.93
据以往的经验,甲乙机器生产的零件尺寸均服从正态分布,标准尺寸为6.00cm。设显著性水平α= 0.05,问两台机器生产的零件尺寸是否合格?两者之间有无显著差异?
10、让10个失眠患者分别服用甲乙两种安眠药,观察延长睡眠时间的情况,得到如下配对数据:
甲药延时量 1.90 0.80 1.10 0.10 -0.10 4.40 5.50 1.60 4.60 3.40
乙药延时量 0.70 -1.60 -0.20 -1.2 -0.10 3.40 3.70 0.80 0.00 2.20
在显著检验性水平α= 0.05下,检验两种药物的疗效有无显著差异?
11、一工厂的两个化验员每天同时从工厂的冷却水中取样,测量一次水中的含氯量(ppm),下面列出10天的记录:
化验员A: 1.15 1.86 0.75 1.82 1.14 1.65 1.90 0. 1.12 1.09
化验员B: 1.00 1.90 0.90 1.80 1.20 1.70 1.95 1.87 1.69 1.92
设各化验员的化验结果服从正态分布,试选用适当的检验过程,检验两个化验员测量的结果之间是否有显著差异?(α= 0.05、0.01)
12、为了评比某种型号的电池质量,分别从A、B、C三个工厂生产的同种型号电池中各随机地抽取5只电池为样本,经试验得到其寿命(小时)如下:
样品
| 工厂 | A1 A2 A3 A4 A5 |
| A B C | 40 48 38 42 45 36 34 30 28 32 39 40 43 50 50 |
13、在周六晚节目单修订前后,分别作了收视率的调查。在节目修改前,收视率记录为
ABC29%,CBS28%,NBC25%,电台18%。节目修改后,300个家庭所组成的样本产生下列电视收视数据:ABC95个家庭,CBS70个家庭,NBC个家庭,电台46个家庭。取显著性水平a = 0.05,检验电视收视率是否已经发生了变化?
卡方检验
14、在周六晚节目单修订前后,分别作了收视率的调查。在节目修改前,300个家庭收视记录为:ABC76个家庭, CBS个家庭,NBC83个家庭,电台52个家庭。节目修改后,300个家庭所组成的样本产生下列电视收视数据:ABC95个家庭,CBS70个家庭,NBC个家庭,电台46个家庭。取显著性水平a = 0.05,检验电视收视率是否已经发生了变化?(请将本题与第13题作比较)。
交叉表
15、一家生产性公司从三家供应商处购买某零件,但该零件经常出现次品。在记录的445件零件质量数据中,100件来自A公司,其中90件质量等级为良好,3件有小缺陷,7件有大缺陷;195件来自B公司,其中170件质量等级为良好,18件有小缺陷,7件有大缺陷;150件来自C公司,其中135件质量等级为良好,6件有小缺陷,9件有大缺陷。取显著性水平a = 0.05,检验供应商与零件质量的性。你的分析结果能告诉采购部门什么?
16、在关于放松(如听音乐等)对成年女性入睡所需时间影响的研究中,抽取了10名女性组成样本。下表给出了10个对象在有放松条件和无放松条件下入睡所需的时间(min)。就此数据你的结论是什么?
| 研究对象 | 无放松 | 有放松 |
| 1 | 15 | 10 |
| 2 | 12 | 10 |
| 3 | 22 | 12 |
| 4 | 8 | 11 |
| 5 | 10 | 9 |
| 6 | 7 | 5 |
| 7 | 8 | 10 |
| 8 | 10 | 7 |
| 9 | 14 | 11 |
| 10 | 9 | 6 |
| 冬季 | 夏季 | 冬季 | 夏季 |
| 18 | 28 | 20 | 29 |
| 20 | 18 | 12 | 23 |
| 15 | 24 | 16 | 38 |
| 16 | 32 | 19 | 28 |
| 21 | 18 | 20 | 18 |
| 计算机公司 | 1.94 | 2.76 | 8.95 | 3.23 | 3.04 | 0.69 | 1.52 |
| 药品公司 | 7. | 1.65 | 2.59 | 1.09 | -1.70 | ||
| 公共服务公司 | 2.26 | 4.66 | 2.22 | 1.77 | -0.15 |
| 年龄 | ||||||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
| 盲人 | 0 | 0 | 0 | 0 | 1 | 8 | 8 | 8 | 0 | 8 | 8 | 8 |
| 蒙眼 | 0 | 8 | 0 | 0 | 2 | 8 | 5 | 6 | 8 | 8 | 3 | 8 |
| 不蒙眼 | 8 | 1 | 8 | 8 | 0 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
(1)每日卡路里的摄入量与体重。
(2)海拔与平均气温。
(3)国内生产总值与新生婴儿的死亡率。
(4)家庭的总收入与文化生活的服务支出。
(5)结婚年龄与受教育的时间。
(6)每日的吸烟数量与肺功能。
21、下表中列出某地区九个市县社会商品零售总额(亿元)、城市居民年平均收入(元)、农民年平均收入(万元)的数据,分别记为变量retail、townsman、farmers。
| 市县编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| retail | 58.75 | 18.29 | 15.29 | 12.58 | 11.24 | 15.60 | 15.09 | 14.36 | 15.14 |
| townsman | 0.468 | 0.375 | 0.410 | 0.370 | 0.430 | 0.379 | 0.350 | 0.360 | 0.370 |
| farmers | 0.166 | 0.135 | 0.151 | 0.149 | 0.154 | 0.125 | 0.104 | 0.119 | 0.159 |
22、某医院研究某种代乳粉的营养价值时,用大白鼠作试验,得大白鼠进食量(克)和增加体重(克)之间的关系的原始数据如下表,用x表示大白鼠进食量和用y表示大鼠增加体重,试作x与y之间的相关分析。
| 进食量x(克) | 820 | 780 | 720 | 867 | 690 | 787 | 934 | 679 | 639 | 820 |
| 增加体重y(克) | 165 | 158 | 130 | 180 | 134 | 167 | 186 | 145 | 120 | 158 |
| id | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| x | 74 | 71 | 75 | 68 | 76 | 73 | 67 | 75 | 70 | 74 |
| y | 76 | 72 | 71 | 70 | 76 | 79 | 65 | 79 | 77 | 72 |
24、4位教师对6名学生的作文竞赛评定的名次如下表。
| " 学生 | 评定教师 | |||
| 1 | 2 | 3 | 4 | |
| 1 | 3 | 4 | 2 | 1 |
| 2 | 4 | 3 | 1 | 3 |
| 3 | 2 | 1 | 3 | 4 |
| 4 | 6 | 5 | 6 | 5 |
| 5 | 1 | 2 | 4 | 2 |
| 6 | 5 | 6 | 5 | 6 |
25、现测得变量x与y的数据如下表:
| i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| x | 49.2 | 50.0 | 49.3 | 49.0 | 49.0 | 49.5 | 49.8 | 49.9 | 50.2 | 50.2 |
| y | 16.7 | 17.0 | 26.8 | 16.6 | 16.7 | 16.8 | 16.9 | 17.0 | 17.0 | 17.1 |
(2)若线性相关,分别求出y关于x和x关于y的回归方程;比较二者的不同。
26、某研究所每年的净收益(income)的主要影响因素为该所每年实际研究费用(fee)和研究人员数量(invest),收集近九年来的数据资料如下:
| fee(万元) | 123.5 | 123.8 | 125.6 | 126.4 | 127.1 | 127.3 | 128.9 | 130.4 | 131.8 |
| invest(人) | 254 | 257 | 275 | 290 | 295 | 296 | 311 | 326 | 341 |
| income(万元) | 1600 | 1630 | 1660 | 1690 | 1720 | 1750 | 1780 | 1840 | 1870 |
| fee : | 135、140、160、188、200 |
| invest : | 360、380、400、400、410 |
