
1.建立相应的数据文件 ,变量视图如下
2.年收入的降序排列
操作过程:
执行Data——sort cases命令,打开排序主对话框,将绩效评分变量移入sort by变量框,sort order选项选择descending命令。
截图如下:
3.对绩效评分变量求秩,将秩值1赋给评分最高者,节的处理方式为High
操作过程:
执行Transform——Rank Cases命令,选择“绩效评价”变量移入Variables变量框,选择Assign rank 1 to largest Value选项,Ties功能按钮下选择high选项。
截图如下
4.对年收入进行等级分组,分组标准为:20000以下→1;,20001-40000→2;40001-60000→3;60001-80000→4;80001-100000→5;100000以上→6。
操作过程:
执行Transform——recode——into different Variables命令,选择“年收入”变量移入input Variable——output Variable变量框,定义output Variable的变量名为“年收入分组”,点击Change按钮。定义Old and New Values .
3.4题前20个变量截图如下
5. 分析分组后年收入的分布情况,并用条形图解释
分析过程:
执行Analyze——Descriptive statistic ——Frequencies命令,选择“年收入分组”变量移入Variables变量框,statistics功能按钮下选择mean、std.deviation,Variance、Range、Minimum、Maximum 等功能。Chart功能按钮下选择chart Type为Bar charts 功能,Chart Values下选择Frequencies功能。
其余用系统默认选项。
条形图如下:
分析结果及分析:
5.统计不同性别员工的奖金情况,奖金金额发放标准为:以绩效评价评分为计算依据,绩效评分的每分奖励90元奖金。描述不同性别员工的平均奖金,最高与最低奖金,总奖金,奖金的标准差等情况
操作过程:
(1)计算奖金:
执行Transform——compute命令,定义Target Variable 为“奖金”,定义Numeric Expression计算公式为“绩效评分”×90。
(2)描述不同性别员工的平均奖金,最高与最低奖金,总奖金,奖金的标准差等情况
执行Analyze——Reports——OLAP Cubes命令打开分层报告主对话框,选择性别做为分组变量,奖金变量为描述变量,statistics命令下选择sum、mean、std.deviation, Minimum、Maximum 等功能。
结果分析:
2、应用第一题第5小题的数据结果,请分析:
(1)用交叉表分析不同工作性质的员工的年收入分布情况;
工作性质年收入交叉表:
用交叉表得卡方检验:
(2)检验不同工作性质的员工与年收入是否关联?是否存在显著的相关关系?
建立散点图,初步观察两变量间有无相关趋势
对工作性质和年收入进行双变量相关性分析,得如下相关性分析数表:
三、应用第一题的数据资料,比较不同性别的员工年收入是否存在显著差异
操作过程:
打开数据文件,执行
Analyze → Compare means → Independent-Sample T Test 命令,打开对话框
从源文件量清单中选择年收入变量移至 Test Variable 框 选择性别变量做为分组变量移入Grouping Variable框内,单击按钮Define Grouping功能按钮 打开Define groups对话框,group1输入0,group2输入1,单击Options按钮,打开选项对话框,设置置信概率及缺损值的处理方式。单击OK,提交系统运行。
结果及分析:
方差分析sig=0.449>0.05
t检验值为0.691,显著性概率为0.495,表明不同性别员工的绩效评分不存在显著差异。
四、应用第一题的数据资料,试分析:
1.应用比较组分析法,一般员工与管理人员的年收入是否存在显著差异?
| Group Statistics | |||||
| 工作性质 | N | Mean | Std. Deviation | Std. Error Mean | |
| 年收入 | 管理人员 | 9 | 33444.44 | 7436.752 | 2478.917 |
| 一般员工 | 14 | 29442.86 | 8032.934 | 2146.2 | |
| Independent Samples Test | ||||||||||
| Levene's Test for Equality of Variances | t-test for Equality of Means | |||||||||
| F | Sig. | t | df | Sig. (2-tailed) | Mean Difference | Std. Error Difference | 95% Confidence Interval of the Difference | |||
| Lower | Upper | |||||||||
| 年收入 | Equal variances assumed | .180 | .676 | 1.199 | 21 | .244 | 4001.587 | 3337.302 | -2938.712 | 10941.887 |
| Equal variances not assumed | 1.220 | 18.201 | .238 | 4001.587 | 3279.356 | -2882.7 | 10885.822 | |||
2.不同工作性质的人员的年收入是否存在显著差异(假设年收入服从正态分布,显著性水平为0.05),如果存在显著差异,请用LSD方法检验哪些工作性质之间年收入存在显著差异?如果不存在显著差异,请用Tambane’s T2方法检验哪些等级之间销售额存在显著差异?
| ANOVA | |||||
| 年收入 | |||||
| Sum of Squares | df | Mean Square | F | Sig. | |
| Between Groups | 2.630E10 | 2 | 1.315E10 | 68.882 | .000 |
| Within Groups | 5.154E9 | 27 | 1.909E8 | ||
| Total | 3.145E10 | 29 | |||
| Multiple Comparisons | ||||||
| 年收入 LSD | ||||||
| (I) 工作性质 | (J) 工作性质 | Mean Difference (I-J) | Std. Error | Sig. | 95% Confidence Interval | |
| Lower Bound | Upper Bound | |||||
| 经理 | 管理人员 | 67448.413* | 6962.701 | .000 | 53162.13 | 81734.69 |
| 一般员工 | 71450.000* | 6395.9 | .000 | 58327.21 | 84572.79 | |
| 管理人员 | 经理 | -67448.413* | 6962.701 | .000 | -81734.69 | -53162.13 |
| 一般员工 | 4001.587 | 5902.917 | .504 | -8110.20 | 16113.37 | |
| 一般员工 | 经理 | -71450.000* | 6395.9 | .000 | -84572.79 | -58327.21 |
| 管理人员 | -4001.587 | 5902.917 | .504 | -16113.37 | 8110.20 | |
| *. The mean difference is significant at the 0.05 level. | ||||||
Sig=0.504>0.05,说明一般员工和管理人员的年收入不存在明显差异。
五.
1.用二元变量相关性分析方法,判断家庭月平均住房支出与月平均收入是否存在显著性相关
操作工程:
依次单击“分析”“相关”“双变量”打开“双变量相关”对话框。
单击 “选项”打开“双变量相关性:选项”对话框。勾选“均值和标准差”“叉积偏差和协方差”,并选中“按对排除个案”。保存设置结果。
结果与分析:
Pearson相关系数为0.930,表示二者存在不完全相关且为正相关。两者之间不相关的双侧显著性值为0.000<0.01。表示在0.01的显著性水平上否定了二者不相关的假设。所以可以得出结论:家庭月平均住房支出与月平均收入存在显著性相关 。
2.检验回归方程的拟合效果如何?
操作过程:
在SPSS中,单击“分析”“回归”“线性”
结论与分析
回归模型调整的R平方是0.855,说明回归的你和度较高。
3. 检验回归方程的回归效果如何?α=0.05
| Anovab | ||||||
| 模型 | 平方和 | df | 均方 | F | Sig. | |
| 1 | 回归 | 2602767.293 | 1 | 2602767.293 | 83.423 | .000a |
| 残差 | 405596.441 | 13 | 31199.726 | |||
| 总计 | 3008363.733 | 14 | ||||
| a. 预测变量: (常量), 家庭月平均收入。 b. 因变量: 平均住房支出 | ||||||
4.用家庭月平均收入为自变量,月平均住房支出为因变量,求回归方程,并解释回归系数的意义。
操作过程:单击主菜单Analyze/Regression/Linner 进入设置对话框,从左边变量表中把因变量“月平均住房支出”选入到因变量框中,把自变量“家庭月平均收入”选入自变量框中,在“方法”一项上保持系统默认的选项“进入”,按“确定”。
分析与结论
| 系数a | ||||||||||||
| 模型 | 非标准化系数 | 标准系数 | t | Sig. | ||||||||
| B | 标准 误差 | 试用版 | ||||||||||
| 1 | (常量) | -639.654 | 181.347 | -3.527 | .004 | |||||||
| 家庭月平均收入 | .370 | .040 | .930 | 9.134 | .000 | |||||||
| a. 因变量: 平均住房支出 | ||||||||||||
| 残差统计量a | ||||||||||||
| 极小值 | 极大值 | 均值 | 标准 偏差 | N | ||||||||
| 预测值 | 284.81 | 1763.95 | 963.47 | 431.175 | 15 | |||||||
| 残差 | -285.319 | 220.938 | .000 | 170.209 | 15 | |||||||
| 标准 预测值 | -1.574 | 1.857 | .000 | 1.000 | 15 | |||||||
| 标准 残差 | -1.615 | 1.251 | .000 | .9 | 15 | |||||||
| a. 因变量: 平均住房支出 | ||||||||||||
故回归估计式为 :Y=0.370X-639.5
回归系数意义就是,收入每增加1元,住房支出就增加0.37元。
5.当家庭月平均收入达到7000元,估计月平均住房支出的值,并求95%置信区
间下限和上限。
去95%置信区间的上下限
操作:依次单击"分析"“描述统计”“探索”,在统计中设置置信区间为95%,
| 描述 | |||||
| 家庭月平均收入 | 统计量 | 标准误 | |||
| 平均住房支出 | 5300 | 均值 | 1450.00 | 50.000 | |
| 均值的 95% 置信区间 | 下限 | 814.69 | |||
| 上限 | 2085.31 | ||||
| 5% 修整均值 | . | ||||
| 中值 | 1450.00 | ||||
| 方差 | 5000.000 | ||||
| 标准差 | 70.711 | ||||
| 极小值 | 1400 | ||||
| 极大值 | 1500 | ||||
| 范围 | 100 | ||||
| 四分位距 | . | ||||
| 偏度 | . | . | |||
| 峰度 | . | . | |||
得Y=1950.355,即月平均住房支出为1950.355元
由的表中可以看出95%的置信区间的下限是814.69,上限是2085.31。
