摘要
近年来,中国房地产业总体在持续升温,作为房地产业里的一大巨头——商品房,其价格在走高中上下震荡。什么原因导致商品房价格变动?用什么方法可以合理预测其价格走势?本文通过查找数据、回归分析,找出商品房价格的影响因素并通过计算得出函数关系式。
关键词:商品房价格影响因素关系式一、选题
近几年来,中国房地产市场异常高涨,作为一种用于经营目的的建筑物——商品房,其价格也在跟随着房地产市场的总价格趋势的变化而变化。那么,是什么原因导致商品房价格的变化呢?能找出这些影响因素从而给预测商
品房价格的变化提供一种合理有效的方法吗?
根据初步推断,商品房平均销售价格[average price of commercial residential
building (yuna/㎡)]的主要影响因素有人均居民储蓄存款余额[average saving
accounts(yuan/per capita)]、人均房地产投资额[average investment to real estate(yuan/per capita)]和城市人口密度[urban population density(per capita/㎡)]。为了方便,记被解释变量商品房平均销售价格为y,人均居民储蓄存款余额为x1,人均房地产投资额为x2, 城市人口密度为x3。
在这一研究中,商品房平均销售价格为被解释变量,三个影响因素为解释变量。一般认为,人均居民储蓄存款越高,人们手头能用于购买商品房的货币越多,商品房的平均销售价格越高;同样,人均房地产投资额越高,期待的回报也就越高,价格也就越高;城市人口密度越大,商品房的需求量越大,供不应求导致价格也就越高。因此,初步断定人均居民储蓄存款余额、人均房地产投资额和城市人口密度对商品房平均销售价格的影响因素都是正向
的。接下来我们将根据收集而来的数据验证这一假设,并得出被解释变量和解释变量之间确定的函数关系式。
二、数据的收集与整理
数据来源:
中经网统计数据库
万得资讯
三、数据描述性分析
(一)选取2009年10个地区的数据用以分析,数据如下表所示。
(二)对表中数据进行描述性分析得如下相关数据:
(Y)average price of commercial
residential building(yuna/㎡)(X1)average saving
accounts(yuan/per
capita)
(X2)average
investment to real
estate(yuan/per
capita)
(X3)urban
population density
(per capita/㎡)
平均6201 平均1637.62 平均3972.543 平均3104.5 标准差4245.1 标准差1454.74 标准差35.4 标准差1310.453 峰度-0.33961 峰度-0.8656 峰度 2.833721 峰度0.172419 偏度0.981825 偏度0.629 偏度 1.622853 偏度0.0943 最小值2452 最小值282.923 最小值532.3824 最小值1224 最大值13799 最大值4233.98 最大值12568.33 最大值5530 (三)依次绘出以各个解释变量数据为X轴,相应的被解释变量为Y轴的散点图。
注:去掉异常点后人均居民储蓄存款余额与商品房平均销售价格大致呈线性正相关。
图2
注:去掉异常点后人均房地产投资额与商品房平均销售价格大致呈线性正相关。
注:由图3知,城市人口密度和商品房平均销售价格存在线性负相关关系。
四、 回归结果分析和检验
依旧取以上用以分析的2009年10个地区的数据来回归分析。 (一) 线性回归。
根据以上所绘制的散点图,三个预测影响因素x1,x2,x3都与y 成线性相关关系,假设回归方程为多元线性回归方程,根据已知数据来回归,结果如下:
根据回归结果得回归方程为:
y=3731.765+0.3x 1+0.836x 2-0.480x 3+u i R ²=0.857 SER=19.8 (1631.5) (1.163) (0.326) (0.341)
说明:在5%的显著性水平下,t=1.96,各系数所对应的t 值和1.96作比较得知在5%的显著性水平下,x 1和x 3影响不显著而x 2和_cons 显著。此时Prob >
.
Mean VIF 2.80 x3 1.50 0.665222 x1 3.31 0.301883 x2 3.58 0.279207 Variable VIF 1/VIF . estat vif
Prob > F = 0.0008 F( 3, 6) = 25.22 ( 3) x3 = 0
( 2) x2 = 0 ( 1) x1 = 0. test x1 x2 x3scalar e(r2_a) = .785783045065133. ereturn list r2_a
_cons 3731.765 1631.506 2.29 0.062 -260.3858 7723.916 x3 -.4797095 .3409613 -1.41 0.209 -1.314012 .3545929 x2 .8360906 .32579 2.57 0.043 .03727 1.633208 x1 .3032 1.163078 0.33 0.749 -2.456917 3.234981 y Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Root MSE = 19.8 R-squared = 0.8572 Prob > F = 0.0008 F( 3, 6) = 25.22Linear regression Number of obs = 10
. regress y x1 x2 x3,robust
F =0.0008,而0.08%<5%,所以,拒绝原假设,x1、x2、x3联合显著。Mean VIF=2.80<5,因此不存在完全多重共线性。
(二) 非线性回归
从散点图可以看出,x3虽然与y 存在线性关系,但仔细观察也不难发现其关系曲线也可拟合成一条凸向原点的曲线,如下图所示:
在该图中,经过处理的数据10000/x3与商品房平均销售价格y 呈现出更强的线性关系。那么,x3经过处理后整个方程的相关关系会不会更强呢?接下来我们将来探究这个问题。
设
place
x31
Beijing Tianjin Shanghai Zhejiang
Yunnan Guizhou Xizang
Shanxi
根据回归结果得回归方程为:
y=1463.803+0.5367x 1+0.8251x 2-150.8302x 31+u i R ²=0.844 SER=2052.9 (1584.8) (0.5367) (0.825) (9.24) 或:
y=1463.803+0.5367x 1+0.8251x 2-1508302/x 3+u i R ²=0.844 SER=2052.9 (1584.8) (0.5367) (0.825)
说明:在5%的显著性水平下,t=1.96,各系数所对应的t 值和1.96作比较得知在5%的显著性水平下,所有系数皆不显著。此时Prob > F =0.0014,而0.14%<5%,所以,拒绝原假设,x 1、x 2、x 3联合显著。Mean VIF=4.,4.<5,因此不存在完全多重共线性。
Mean VIF 4.
x31 2.97 0.336612 x1 3.82 0.261639 x2 7.11 0.140600 Variable VIF 1/VIF . estat vif
Prob > F = 0.0014 F( 3, 6) = 21.22 ( 3) x31 = 0
( 2) x2 = 0 ( 1) x1 = 0. test x1 x2 x31scalar e(r2_a) = .7661516907448712. ereturn list r2_a
_cons 1463.803 1584.802 0.92 0.391 -2414.068 5341.673 x31 150.8302 9.2357 0.23 0.824 -1437.792 1739.453 x2 .8251421 .4694709 1.76 0.129 -.3236117 1.9736 x1 .5366779 1.110212 0.48 0.6 -2.179913 3.253269 y Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Root MSE = 2052.9 R-squared = 0.8441 Prob > F = 0.0014 F( 3, 6) = 21.22Linear regression Number of obs = 10. regress y x1 x2 x31,robust
由(一)和(二)中回归结果知,(二)中非线性模型有比(一)中线性模型更小的R²和更大的MER,但非线性模型中所有变量的t值都小于1.96,即在非线性模型中,所有系数在5%的显著性水平下都具有显著性。两个模型中所有系数都是联合显著。
五、面板回归数据
(一)n-1个二值变量模型
引入虚拟变量,对面板数据进行回归,得到如下结果:. gen y10=(year==2010)
. gen y11=(year==2011)
. gen y12=(year==2012)
. gen y13=(year==2013)
. gen p1=(place==1)
. gen p2=(place==2)
. gen p3=(place==3)
. gen p4=(place==4)
. gen p5=(place==5)
. gen p6=(place==6)
. gen p7=(place==7)
. gen p8=(place==8)
. gen p9=(place==9)
. gen p10=(place==10)
. reg y x1 x2 x3 i.year i.place,robust
Linear regression Number of obs = 50 F( 16, 33) = 356.14 Prob > F = 0.0000 R-squared = 0.9930 Root MSE = 485.8
Robust
y Coef. Std. Err. t P>|t| [95% Conf. Interval]
x1 -.3775578 .4403411 -0.86 0.397 -1.273439 .5183229 x2 .3184051 .1150481 2.77 0.009 .0843379 .5524722 x3 .38471 .187011 2.06 0.048 .0042334 .7651867
year
2010 857.2466 230.46 3.72 0.001 388.3121 1326.181 **** ****.567 252.5979 4.19 0.000 543.6523 1571.481 2012 934.2916 273.9513 3.41 0.002 376.9335 1491.65 2013 1430.662 324.1975 4.41 0.000 771.0771 2090.246
place
2 -16.691 1459.45 -4.40 0.000 -9385.965 -3447.418
3 -1142.832 994.0603 -1.15 0.259 -3165.263 879.5986
4 -5382.04 671.0258 -8.02 0.000 -6747.252 -4016.828
5 -6801.60
6 819.5625 -8.30 0.000 -8469.018 -5134.193
6 -11852.4 1006.282 -11.78 0.000 -139.
7 -9805.108
7 -11160.75 867.7679 -12.86 0.000 -12926.24 -9395.266
8 -11071.15 926.4577 -11.95 0.000 -12956.04 -9186.259
9 -10669.01 987.2854 -10.81 0.000 -12677.66 -8660.365
10 -11449.13 1070.279 -10.70 0.000 -13626.63 -9271.63 _cons 11954.65 1021.343 11.70 0.000 9876.712 14032.59由回归结果可知,个体固定效应下的回归方程为:
Y=11954.65-0.378x1+0.318x2+0.385x3+857.25D2i+1057.567D3i
+934.29D3
i +1430.662D4
i
-16.691B2
i
-1142.832B3
i
-5382.07B4
i
-6801.606B5
i -11852.4B6
i
-11160.75 B7
i
-11071.15 B8
i
-10669.01
B9
i -11449.13 B10
i
+u
i
R2=0.9930 SER=485.8
R²为0.9930,拟合程度教高。X1和B3所对应的t值的绝对值都小于1.96,因此在5%的显著性水平下,X1和B3对y的影响显不著而其他变量对Y的影响显著。
(二)固定效应模型
对面板数据进行个体固定效应回归,得到如下结果:
由回归结果可知,个体固定效应下的回归方程为:
y=4360.087-0.377x 1+0.3184x 2+0.385x 3+857.25B1i +1057.567 B2i +934.29B3i
(526.228) (0.462) (0.318) (0.20) (260.58) (174.26) (197.74)
+1430.66 B4i + u i (248.51) 组间、组内和总体的R ²分别为0.7145、0.6854和0.66,说明拟合程度不是很高。X2和-cons 所对应的t 值的绝对值都大于1.96,因此在5%的显著性水平下,X2和-cons 对y 的影响显著而x1和x3不显著。
六、 结论
rho .98790282 (fraction of variance due to u_i)
sigma_e 485.8026
sigma_u 4390.1043 _cons 4360.087 526.2279 8.29 0.000 3169.677 5550.497
2013 1430.662 248.517 5.76 0.000 868.4772 1992.846 2012 934.2916 197.7438 4.72 0.001 486.9 1381.619 2011 1057.567 174.2637 6.07 0.000 663.3547 1451.778 2010 857.2466 260.5826 3.29 0.009 267.7679 1446.725 year
x3 .38471 .2001444 1.92 0.087 -.0680481 .8374682 x2 .3184051 .1185044 2.69 0.025 .0503296 .58805 x1 -.3775578 .4623827 -0.82 0.435 -1.42354 .6684245 y Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
(Std. Err. adjusted for 10 clusters in place)corr(u_i, Xb) = 0.3604 Prob > F = 0.0000 F(7,9) = 48.94 overall = 0.3117 max = 5 between = 0.4133 avg = 5.0R-sq: within = 0.8133 Obs per group: min = 5Group variable: place Number of groups = 10Fixed-effects (within) regression Number of obs = 50. xtreg y x1 x2 x3 i.year,fe vce(cluster place)
delta: 1 unit
time variable: year, 2009 to 2013 panel variable: place (strongly balanced). xtset place year
y=4360.087-0.377x
1+0.3184x
2
+0.385x
3
+857.25B1
i
+1057.567 B2
i
+934.29B3
i
(526.228) (0.462) (0.318) (0.20) (260.58) (174.26) (197.74)
+1430.66 B4
i + u
i
(248.51)
房地产价格主要影响因素有三个,人均居民储蓄余额与其呈反比,在其他因素不变的情况下,人均居民储蓄余额增加,房地产价格上升;人均房地产投资额与其呈正比,在其他因素不变的情况下,人均房地产投资额增加,房地产价格上升;人口密度也与其呈正比。控制房价,应充分利用这三个影响因素。