
一一一
华北科技学院 基础部 北京东燕郊 065201
摘要:在计划经济时代,由于中国推行男女性别平等的就业制度和工资分配制度,因而城市劳动力性别工资差异并不明显。经济改革以来,伴随着由计划经济向市场经济的转型,工资分配机制发生了根本改变,性别工资差异越来越明显。性别分割是我国劳动力市场上一直存在的一种现象,性别收入差距总体趋势在扩大;个体特征差异能够在一定程度上解释性别收入差异,现阶段性别收入差异在很大程度上是由于劳动者本身的人力资本水平引起的,是正常合理的范围;歧视仍然是造成性别收入差距的一个原因,女性在获得教育的机会上还是比男性要低,而且女性很难进入到高收入行业和职业,使得在教育方面女性仍然处于不利地位。本文将运用SPSS二元回归分析探究不同月均收入对应的男女比例并得出结论,旨在对分析结果提出一些有建设性的建议。
关键词:logistic回归分析;SPSS软件;人均收入;性别比例
Based on SPSS logistic regression analysis to explore the sex ratio of different monthly income
NIU Xiaoyu
(North China institute of science and technology,Beijing,065201,China)
Abstract: In the era of planned economy, as a result of the Chinese government to implement gender equality employment system and salary distribution system, and urban labor gender wage gap is not obvious. Since the economic reform, with the transition from planned economy to market economy, fundamental changes have taken place in wage distribution mechanism, the gender wage gap is more and more obvious. Gender segmentation is China's labor market has been a phenomenon of gender overall trend in the expanding income gap; Individual characteristics can partly explain the gender income differences, gender differences at present stage is largely caused by the human capital level of laborer itself, is a normal reasonable range; Discrimination is still a cause of the gender pay gap, women in the opportunity to gain education or lower than men, women and it is hard to get into to high income industry and profession, making women still at a disadvantage in terms of education. This paper will use SPSS binary regression analysis to explore the sex ratio of different monthly income and concludes that, to the results of the analysis put forward some constructive Suggestions.
Keywords:Logistic regression analysis; SPSS software; Per capita income;Sex ratio
1.引言
经济改革之前,中国女性劳动年龄人口基本上实现了普遍就业,女性劳动力参与率超过90%,女性劳动力几乎占总劳动力的半数(48%),女性就业者平均工资占男性就业者平均工资的84%。与世界上其他国家相比较,当时中国女性劳动力参与率和男女就业者的平均工资之比都保持在较高水平,这也意味着,经济改革之前,中国在劳动就业领域的性别平等化程度较高[1]。
经济改革开始以后,推行性别平等的力度明显弱化,国家不再扮演女性劳动力的保护者角色。的变化必然影响到女性劳动力在劳动就业领域中的地位状况,最明显的一个例子是女性劳动年龄人口的就业率逐步下降。同时,经济改革的实施,导致了市场经济逐步取代原有的计划经济,收入分配机制发生根本改变,从而男女就业者的收入差距也开始发生变化。性别分割是我国劳动力市场上一直存在的一种现象,性别收入差距总体趋势在扩大;个体特征差异能够在一定程度上解释性别收入差异,现阶段性别收入差异在很大程度上是由于劳动者本身的人力资本水平引起的,是正常合理的范围;歧视仍然是造成性别收入差距的一个原因,女性在获得教育的机会上还是比男性要低,而且女性很难进入到高收入行业和职业,使得在教育方面女性仍然处于不利地位。但是经过20年的发展,对女性的歧视逐步减弱[2]。
2.基本理论
回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题[3]。
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,分为回归和多重回归分析;按照自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多重线性回归分析。logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于他们的因变量不同。
在数据分析的时候,也可以将此推广到多个自变量的多元回归。此外,在SPSS的结果输出里,还可以汇报R2,F检验值和T检验值。R2又称为方程的确定性系数(coefficient of determination),表示方程中变量X对Y的解释程度。R2取值在0到1之间,越接近1,表明方程中X对Y的解释能力越强。通常将R2乘以100%来表示回归方程解释Y变化的百分比。F检验是通过方差分析表输出的,通过显著性水平(significant level)检验回归方程的线性关系是否显著。一般来说,显著性水平在0.05以上,均有意义。
此篇文章主要运用二元回归分析。
3. 基于SPSS logistic回归分析探究不同月均收入的男女比例
3.1 原始数据
表-1 原始数据
| 月均收入 | 性别 | 月均收入 | 性别 | 月均收入 | 性别 | 月均收入 | 性别 | 月均收入 | 性别 | 月均收入 | 性别 |
| 5 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 4 | 1 | 4 | |
| 5 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 1 | 3 | 1 |
| 5 | 1 | 2 | 1 | 2 | 1 | 4 | 2 | 1 | 3 | 1 | |
| 5 | 1 | 2 | 1 | 2 | 1 | 4 | 1 | 3 | 1 | 4 | 1 |
| 4 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 4 | 1 |
| 3 | 1 | 2 | 1 | 2 | 2 | 3 | 1 | 3 | 1 | 4 | 1 |
| 5 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 1 | 4 | 1 |
| 5 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 4 | 1 | 3 | 2 |
| 1 | 3 | 1 | 1 | 1 | 3 | 1 | 4 | 1 | 3 | 1 | |
| 1 | 2 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 3 | 1 | |
| 1 | 3 | 1 | 2 | 1 | 3 | 2 | 3 | 1 | 3 | 1 | |
| 4 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 4 | 1 | 2 | 1 |
| 4 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 4 | 2 | 3 | 1 |
| 4 | 2 | 3 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 1 |
| 4 | 2 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 1 |
| 4 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 2 |
| 5 | 2 | 2 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 3 | 1 |
| 4 | 2 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 1 | 3 | 1 |
| 3 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 4 | 1 | 3 | 1 |
| 1 | 3 | 1 | 2 | 1 | 3 | 1 | 4 | 1 | 3 | 1 | |
| 4 | 1 | 3 | 1 | 2 | 1 | 2 | 1 | 3 | 1 | 3 | 1 |
| 2 | 1 | 3 | 2 | 1 | 2 | 1 | 3 | 1 | 4 | 1 | |
| 2 | 1 | 4 | 1 | 2 | 1 | 2 | 1 | 4 | 2 | 2 | 1 |
| 4 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 4 | 2 | 3 | 1 |
| 3 | 2 | 3 | 1 | 2 | 1 | 1 | 3 | 1 | 3 | 1 | |
| 3 | 1 | 4 | 1 | 2 | 2 | 3 | 1 | 3 | 1 | 3 | 1 |
| 4 | 2 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 1 | 2 | 1 |
| 3 | 1 | 5 | 1 | 3 | 1 | 4 | 4 | 2 | 2 | 1 | |
| 2 | 1 | 3 | 1 | 2 | 1 | 5 | 1 | 3 | 2 | 3 | 1 |
| 2 | 2 | 2 | 1 | 2 | 1 | 5 | 1 | 3 | 1 | 3 | 1 |
| 2 | 1 | 2 | 2 | 2 | 2 | 3 | 1 | 4 | 1 | 3 | 1 |
| 4 | 2 | 2 | 1 | 2 | 2 | 5 | 1 | 4 | 2 | 3 | 1 |
| 3 | 1 | 3 | 1 | 2 | 1 | 5 | 1 | 4 | 1 | 3 | 1 |
| 3 | 1 | 3 | 1 | 2 | 1 | 5 | 1 | 3 | 1 | 2 | 1 |
| 3 | 1 | 3 | 1 | 2 | 1 | 5 | 1 | 3 | 1 | 3 | 1 |
| 4 | 2 | 4 | 1 | 2 | 1 | 4 | 1 | 4 | 2 | 2 | 2 |
| 3 | 1 | 3 | 1 | 3 | 2 | 5 | 1 | 3 | 1 | 2 | 1 |
| 2 | 1 | 2 | 2 | 3 | 1 | 4 | 1 | 3 | 1 | 2 | 1 |
| 3 | 1 | 2 | 1 | 3 | 2 | 5 | 1 | 3 | 1 | 4 | 1 |
| 3 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 4 | 1 | 2 | 1 |
| 3 | 1 | 3 | 1 | 2 | 1 | 2 | 1 | 4 | 1 | 2 | 1 |
| 2 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 2 | 3 | 1 |
| 2 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 2 | 2 | 1 |
| 3 | 1 | 3 | 1 | 3 | 2 | 5 | 1 | 4 | 2 | 2 | 1 |
| 3 | 1 | 3 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 2 | 2 |
| 2 | 1 | 5 | 1 | 3 | 1 | 3 | 1 | 3 | 2 | 1 | |
| 2 | 1 | 4 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | 2 |
| 2 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 4 | 1 | 3 | 1 |
| 2 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 3 | 1 |
| 2 | 1 | 4 | 1 | 3 | 1 | 5 | 1 | 5 | 1 | 2 | 1 |
| 2 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 2 | 1 |
| 1 | 2 | 4 | 1 | 3 | 1 | 5 | 1 | 3 | 1 | 2 | 1 |
| 1 | 2 | 4 | 1 | 3 | 1 | 5 | 1 | 3 | 1 | 3 | 1 |
| 2 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 3 | 1 | 2 | 1 |
| 5 | 1 | 5 | 1 | 3 | 1 | 4 | 1 | 3 | 1 | 2 | 1 |
| 3 | 1 | 4 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 2 | 1 |
| 3 | 1 | 5 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 2 | 1 |
| 4 | 1 | 4 | 3 | 1 | 3 | 1 | 4 | 1 | 3 | 1 | |
| 3 | 1 | 5 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 2 | 2 |
| 2 | 1 | 5 | 1 | 4 | 1 | 3 | 1 | 4 | 1 | 3 | 2 |
| 3 | 1 | 5 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 2 | 1 |
| 4 | 1 | 4 | 1 | 3 | 1 | 3 | 1 | 4 | 1 | 2 | 1 |
| 3 | 1 | 4 | 1 | 3 | 1 | 3 | 1 | 5 | 2 | 2 | 1 |
| 3 | 1 | 4 | 1 | 3 | 1 | 2 | 1 | 3 | 1 | 3 | |
| 3 | 1 | 4 | 1 | 3 | 1 | 3 | 1 | 3 | 1 | 2 | 2 |
| 2 | 1 | 4 | 1 | 3 | 1 | 3 | 1 | 5 | 2 | 2 | 1 |
| 2 | 1 | 5 | 1 | 2 | 1 | 3 | 1 | 2 | 1 | ||
3.2案件处理摘要
表-2案件处理摘要
| Case Processing Summary | |||
| Unweighted Casesa | N | Percent | |
| Selected Cases | Included in Analysis | 3 | 97.0 |
| Missing Cases | 12 | 3.0 | |
| Total | 401 | 100.0 | |
| Unselected Cases | 0 | .0 | |
| Total | 401 | 100.0 | |
| a. If weight is in effect, see classification table for the total number of cases. | |||
分析输出结果可知,在收集的401组数据中有3组数据有效,占总数据的91%,有12组数据无效,占总数据的1%。
3.3 初始分类表
表-3显示的是初始分类表。Logistic建模如同其他很多种建模方式一样,首先对模型参数赋予初始值,然后借助迭代计算寻找最佳值。以误差最小为原则,或者以最大似然为原则,促使迭代过程收敛。当参数收敛到稳定值之后,就给出了我们需要的比较理想的参数值。这个结果主要用于对比,比较模型参数收敛前后的效果。
表-3分类表
| Classification Tablea,b | |||||
| Observed | Predicted | ||||
| 性别 | Percentage Correct | ||||
| 男 | 女 | ||||
| Step 0 | 性别 | 男 | 348 | 0 | 100.0 |
| 女 | 41 | 0 | .0 | ||
| Overall Percentage | .5 | ||||
| a. Constant is included in the model. | |||||
| b. The cut value is .500 | |||||
表-4显示的是系统对模型的最初赋值方式。最开始仅仅对常数项赋值,结果为B=-2.139,标准误差为S.E.=0.161。所以Wald值为167.769,p<0.01。Exp(B)是B还原之后数值,Exp(B)=e^B=0.118。
表-4初始方程中的变量
| B | S.E. | Wald | df | Sig. | Exp(B) | ||
| Step 0 | Constant | -2.139 | .165 | 167.759 | 1 | .000 | .118 |
表-5是不在初始方程中的变量。表中给出了Score检验值及其对应的自由度df和P值。从表中可以看出可以看到,Q1.7与Q1.7(1)的Score检验值满足一般的要求,而其他变量的数值偏低。
表-5不在初始方程中的变量
| Variables not in the Equation | |||||
| Score | df | Sig. | |||
| Step 0 | Variables | Q1.7 | 19.750 | 4 | .001 |
| Q1.7(1) | 10.101 | 1 | .001 | ||
| Q1.7(2) | .018 | 1 | .4 | ||
| Q1.7(3) | 6.847 | 1 | .009 | ||
| Q1.7(4) | 7.407 | 1 | .006 | ||
| Overall Statistics | 19.750 | 4 | .001 | ||
表-6为最终预测分类表。经过迭代运算,模型参数逐渐收敛到稳定值。利用最终的logistic模型,可以对因变量进行预测,预测结果可以看出,预测正确率为.7%。
表-6最终预测分类表
| Classification Tablea | |||||
| Observed | Predicted | ||||
| 性别 | Percentage Correct | ||||
| 男 | 女 | ||||
| Step 1 | 性别 | 男 | 347 | 1 | 99.7 |
| 女 | 39 | 2 | 4.9 | ||
| Overall Percentage | .7 | ||||
| a.The cut value is .500 | |||||
表-6为最终方程中的变量。B对应的是最终模型参数估计值:常系数为-2.234,Q1.7(1)的回归系数为2.927。Q1.7(2)的回归系数的置信度达到80%以上。
表-7最终方程中的变量
| Variables in the Equation | |||||||
| B | S.E. | Wald | df | Sig. | Exp(B) | ||
| Step 1a | Q1.7 | 14.329 | 4 | .006 | |||
| Q1.7(1) | 2.927 | 1.367 | 4.583 | 1 | .032 | 18.667 | |
| Q1.7(2) | .132 | .686 | .037 | 1 | .848 | 1.141 | |
| Q1.7(3) | -.458 | .677 | .457 | 1 | .499 | .633 | |
| Q1.7(4) | .847 | .682 | 1.543 | 1 | .214 | 2.333 | |
| Constant | -2.234 | .607 | 13.518 | 1 | .000 | .107 | |
| a. Variable(s) entered on step 1: Q1.7. | |||||||
1.在众多数据中,男性人数远多于女性人数。
2.在相同的月均收入中,男性占绝大多数,处于主导地位。获得高薪的女性所占比例很小。
3.企业在招聘人才时,应注意男女的比例协调,在分配薪资时,应该客观合理。
参考文献:
