
上市公司年报数据分析案例
经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总体数据进行处理,以认识总体变量分布状态(如正态分布)、特征表现(如结构相对数、平均数和标准差)、相关关系(如相关系数)和变化规律(如回归模型),从而了解事物或现象的本质及其依存因素。其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不同特征相互联系的紧密程度,揭示变化形式和规律。本章案例主要通过对总体静态数据处理过程的介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。
本章由1个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。
上市公司年报数据分析案例的教学目的:数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对1999年沪深股市制造业上市公司年报数据分析过程的介绍,给读者以处理总体静态数据的思路和技巧,从而训练读者解决实际问题的能力。
案例的背景分析与数据资料
一、案例的现实意义
上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是的决策与监督,都是不可或缺的。
本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。
二、案例所依托的总体及其现状与研究目的
(一)案例所依托的客体
本案例所依托的客体是1999年上市公司年报中的有关财务指标。1999年末,沪、深两市共有上市公司949家。这些上市公司分布在13个行业部门。根据中国的《上市公司分类指引》中规定的分类方法,其中制造业共有578家,占60.91%。总股本1938亿元,占62.73%,制造业是上市公司最集中的行业。截止2000年4月30日,已公布年报的有560家。所以本案例研究的总体范围确定为如期公布年报的制造业560家上市公司。
(二)案例研究的目的与任务
1.上市公司年报财务数据统计分析的目的
通过对制造业1999年报有关数据进行系统的统计整理、描述和回归分析,揭示1999年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。
2.上市公司年报财务数据统计分析的任务
对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。
3.上市公司年报财务数据统计分析的对象
本案例所引用资料取自《上海证券报》,包括了制造业560家上市公司。共选有8个财务指标:总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。其中,前4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。
4.数据的初步分析——制造业上市公司行业结构
在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据《上市公司分类指引》,制造业进一步分为10个行业种类,编码为C0、C1、C2、…、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。
表2—1 制造业上市公司行业分布
代码行业分类上市公司数比重(%)
C0 食品、饮料48 8.57
C1 纺织、服装、皮毛45 8.04
C2 木材、家具 2 0.36
C3 造纸、印刷16 2.86
C4 石油、化学130 23.21
C5 橡胶、塑料10 1.79
C6 金属、非金属96 17.14
C7 机械、仪表、设备151 26.96
C8 通讯、电子51 9.11
C9 其他11 1.96
合计560 100.00
这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。1999年560个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等);23%是石化类行业;而冶金、钢铁等金属非金属类公司占17%;通讯电子章9%。所以,制造业上市公司中传统产业占了较大比重。这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。行业的分布也体现了国家的产业导向,在1999年新发行的A股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。
方案设计
一、案例设计的思路
本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据进行处理:
1.分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。
2.分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。
3.分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。
4.分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。
5.分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上
进行回归分析,从而更深层次地认识总体的规律与特征。
6.在上述研究分析的基础上给出关于对对象的定性认识结论。
二、案例设计的工作过程
(一)数据整理与描述
1.编制按各财务指标的变量数列
(1) 将数据顺序排列。
(2) 计算描述统计指标。
在Excel “工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。其内容是; 平均——算术平均数,即x =n x ∑ 标准误差——抽样平均误差,即n σ
中值——中位数,即Me ;
模式——众数,即Mo ;
标准偏差——标准差,即σ;
样本方差——方差,即2σ 峰值——峰度,即44
σm 偏斜度——偏度,即33σm ;
区域——全距,即最大值减最小值;
求和——标志总量;
计数——总体单位总数;
最大(K )——第K 个最大值;
最小(K )——第K 个最小值;
置信度——“数据分析”中默认概率为95%(也可自行选择)的1/2误差范围。
(3)分析描述统计指标——比较平均数、众数、中位数的大小;偏度系数的大小、方向等。
(4)确定组数和组距——当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、分布明显偏态时,以平均数为中心,以K 倍标准差为组距。
(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。
2.制造业公司主要财务指标的分布
(1)总资产分布数列和直方图
总资产描述统计1 平均 标准误差 中值 158315.1
70.946
95296.9
标准偏差;样本方差峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度(95%)212291.3 4.51E+10 30.19077 4.705128 2178598 12256.69 2190846 886552
560 17620.
总资产描述统计2
平均
标准误差中值
模式
标准偏差;样本方差峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度(95%)1440.7 6388.948 95410.48
149424.9 2.23E=10 9.916375 2.885238 955269.6 21671.49 976941.1 79118478 547 12549.92
从描述统计1看,560家公司的总资产呈高度偏态。总资产最大值是上海石化219亿元,最小值是ST黔凯涤1.2亿元,相差近200倍。将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。但仍呈偏态,不能用斯特吉斯经验确定组数。
不论何种分布,均值和方差其分布的两个主要特征值。根据切比雪夫定理,可以平均数为中心,以K倍的标准差为组距,因为此时平均数 K倍的标准差所涵盖的数据范围不小于1-1/2
K。
本例中,均值14.5亿元,中位数9.5亿元,标准差15亿元,说明560家公司的总资产分布为右偏态。若以1个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用1/2标准差,即7.5亿元为组距,由于100亿元以上只有7家,将105亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。
表2—2 560家上市公司总资产分组统计分组(万元)频数频率(%)
75000以下75000~150000 150000~225000 225000~300000 300000~375000 375000~450000 450000~525000 525000~600000 600000~675000 675000~750000 750000~825000 825000~900000 900000~975000 975000~1050000 1050000以上209
192
33
18
15
4
2
4
6
2
1
3
1
6
37.32
34.29
11.43
5.
3.21
2.68
0.71
0.36
0.71
1.07
0.36
0.18
0.54
0.18
1.07
合计560 100.00
从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。82%的上市公司总姿产在22.5亿元以下,100亿元以上的只有1%。在各行业中,总资产规模最大的是C8——通信电子行业20.3亿元,最低的是C2——木材家具业6.38亿元,另外,C4——石油化工、C5——橡胶塑料、C6——金属非金属的总资产规模在平均之上。
频数
50
100
150
200
250
750001500002250003000003750004500005250006000006750007500008250009000009750001
50000其他
图2—1 560家制造业公司总资产分布
(2)净利润分布数列和直方图
净利润描述统计
平均 标准误差 中值 模式 标准偏差; 样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度 (95%)
6669.48
516.2828
4120.1
# N/A
12217.48
1.49E+08
11.33344
2.485572
112886.5
-37417.9
75468.6
3734913
560
1014.092
净利润分布呈右偏态。以1/2标准差6500万元为组距,可分17组。分组后3.25亿元以上各组不仅频数少,而且有两组频数为0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。见表2—3和图2—2。
表2—3 560家上市公司净利润分布 净利润分组(万元) 频 数 (个) 频 率 (%)
-13000以下 -13000~-6500 -6500~0 0~6500 6500~13000 13000~19500 19500~26000 26000~32500 32500以上 14 10 22 332 112 24 13 16 17 2.50
79
3.93
59.29
20.00
4.29
2.32
2.86
3.04
合 计 560 100.00
频数
50
100
150
200
250
300
350
-13000-65000650013000195002600032500其他
净利润分组(万元)
图2—2 560家上市公司净利润分布
将亏损1.3亿元以下的公司合并为一组,3.25亿元以上的公司合并为一组,组数减少到9组,总体仍为右偏态。
从整理后的净利润的资料我们注意到:
第一,制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。
第二,制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利润只有6500万元。79%的上市公司净利润在70万~1.3亿元之间。
第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在7亿元以上;
第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;C0——食品饮料净利闰0.79亿元;C6——金属非金属净利闰0.85亿元;C8——通信电子净利闰1亿元。
(3)每股收益分布数列和直方图
每股收益描述统计 1
平均
标准误差中值
模式
标准偏差;样本方差峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度(95%)0.199427 0.011551 0.2225 0.21
0.273352 0.074721 6.751 -1.51182 2.632
-1.28 1.352 111.6792 560
0.0226
每股收益描述统计2
平均
标准误差中值
模式
标准偏差;样本方差峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度(95%)0.204943 0.010571 0.223
0.21
0.249255 0.062128 4.912174 -1.27499 1.81
-0.98 0.9091 113.9482 556
0.0207
每股收益是一强度相对指标。从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。尝试按经验公式确定组数:
组数=1+3.322×㏒560=10;
组距=2/10=0.2,极值用开口组处理。见表2—4 和图2—3。
表2—4 560家上市公司每股收益分组统计 分 组 频数(个) 频率(%)
—0.6以下 -0.6~-0.4 -0.4~—0.2 -0.2~0 0~0.2 0.2~0.4 0.4~0.6 0.6~0.8 0.8~1.0 1.0以上 14 6 13 13 197 231 60 19 6 1 2.50
1.07
2.32
2.32
35.18
41.25
10.71
3.39
1.07 0.18
合 计 560 100.00
频数
50
100
150
200
250
-0.6-0.4-0.200.20.40.60.81
每股收益分组(元)
图2—3 560家上市公司每股收益分布
每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公司经营业绩水平。不仅在行业之间,而且可以在公司之间进行比较。从表2—4图2—3看560家公司每股收益的特点:
第一,1999年制造业的每股收益的分布略乘左偏态,即平均数为0.2元,但是相对多数的公司每股收益高于0.2元。
第二,35%的公司在0.01~0.2元的微利水平,52%的公司盈利水平再0.2~0.6元之间。26家公司盈利水平较高,在0.6元以上,但只占4.5%。1999年的改制表状元是五粮液,达到每股收益1.35元。
第三,分行也看,经营业绩差别的行业因素非常明显:最高的是C0——食品饮料,达到每股收益0.31元;大于等于每股收益0.2元的还有C1—纺织、服装,C5——橡胶塑料, C8 ——同新点子,C9——其他;最低的事C2——木材家具,只有0.08元。
(4)净资产收益率分布数列和直方图
平均
标准误差中值
模式
标准偏差;样本方差峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度(95%)2.971477 1.993256 9.04
6.21
47.08475 2216.974 117.58 -10.1028 736.156 -639.53 96.626 1658.08 558
3.915216
净资产收益率2
平均
标准误差中值
模式
标准偏差;样本方差峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度(95%)8.006386 0.352228 9.14
6.21
8.185041 66.9949 6.881908 -1.63102 69.26
-34.92 34.34 4323.448 540
0.691909
由于资料中两个公司(0515PT渝钛白和600818ST永久)的净利润净资产为负值,所以此处只有58个公司的数据。
558个公司的净资产旅呈高度左偏态。净资产收益率过高或过低,都数不正常情况。
舍弃40%以上和-40%以下的18个极端值后,描述指标基本正常。以1倍标准差8%为组距、48%以上和-48%一下合并各1组,共分14组。表2——5和图2——4显示,集中趋势非常明显。
表2——5 560家公司净资产收益率分组统计
分组(%)频数频率(%)
小于-48 13 2.33
-48~-40 -40~-32 -32~-24 -24~-16 -16~-8 -8~0 0~8 8~16 16~24 24~32 32~40 40~48 大于48 1 2 5 6 8 10 190 270 39 7 3 1 3 0.18
0.36
0.90
4.08
1.43
1.79
34.05
48.39
6.99
1.25
0.54
0.18
0.54
合计 558 100.00
频数
50
100
150
200
250
300
-48-40-32-24-16-8081624324048其他
净资产收益率分组(%)
图2—4 560家上市公司净资产收益率分布
净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。从统计资料看到:
第一,1999年度,制造业的总体净资产收益率9%(这里采用了中位数,因为忽略极值厚中位数没有
第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。
第三,34%的公司净资产收益率在0.1%~8%之间;48%的公司在0.8%~16%之间。
第四,8%的公司净资产在16%~32%的高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。
3.制造业各行业主要财务指标的分布
接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。
(1)制造业各行业净利润分布频数统计表和频率统计表
合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表2—6、表2—5)。
表2—6 制造业各行业净利润分布统计(频数)
代码
净利润分组(万
元)
行业分类
小
于
-1.
3
-1.
3
~
-0.
65
-0.
65
~0
0~
0.6
5
0.6
5
~
1.3
1.3
~
1.9
5
1.9
5
~
2.6
2.6
~
3.2
5
大
于
3.2
5
合
计
C0 食品、饮料 1 27 14 3 1 1 1 48
C1 纺织、服装、皮毛 1 1 2 27 13 1 45
C2 木材、家具 1 1 2
C3 造纸、印刷 1 12 3 16
C4 石油、化工 2 2 5 81 28 6 2 4 130 C5 橡胶、塑料8 1 1 10
C6 金属、非金属 3 4 2 53 17 4 3 5 5 96
C7 机械、仪表、设备 6 10 94 24 4 5 4 4 151 C8 通信、电子 2 2 1 22 10 3 4 4 3 51
C9 其他7 2 2 11 合计14 10 22 332 112 24 13 16 17 560
从表2—6、2—7中可以看到:
第一,总共45个亏损公司,占全部公司的8%,他们的行业间分布是:C7——机械、仪表、设备行业亏损面最大,有16家,占行业10.7%;其次是C8、C6和C1——分别为9.8%、9.4%、8.8%;C2——木材家具仅有2家公司,亏损1家。
第二,C5——橡胶、塑料和C9——其他行业无亏损企业,且净利润水均衡,集中在0~19500万元。
第三,净利润绝对水平的高低与行业类别有关联,3亿元以上净利润集中在酿酒、石化、冶金、电子通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。
表2—7 制造业各行业净利润分布统计(频率%)
代码净利润分组(万
元)
小
于
-1.
-1.
3
~
-0.
65
~0
0~
0.6
5
0.6
5
~
1.3
~
1.9
1.9
5
~
2.6
~
3.2
大
于
3.2
合计
行业分类 3 -0.
65
1.3 5
2.6 5 5
C0 食品、饮料 2.1 56.
3 29.
2
6.3 2.1 2.1 2.1 100.0
C1 纺织、服装、皮毛 2.2 2.2 4.4 60.
0 28.
9
2.2 100.0
C2 木材、家具50 50.
100.0
C3 造纸、印刷 6.3 75.
0 18.
8
100.0
C4 石油、化工 1.5 1.5 3.8 62.
3 21.
5
4.6 1.5 3.1 100.0
C5 橡胶、塑料80.
0 10.
10.
100.0
C6 金属、非金属 3.1 4.2 2.1 55.
2 17.
7
4.2 3.1
5.2 5.2 100.0
C7 机械、仪表、设备 3.3 6.7 62.
7 16.
2.7
3.3 2.7 2.7 100.0
C8 通信、电子 3.9 3.9 2.0 43.
1 19.
6
5.9 7.8 7.8 5.9 100.0
C9 其他63.
6 18.
2
18.
2
100.0
合计 2.3 1.8 3.9 59.
4 20.
4.3 2.3 2.9 3.0 100.0
(2)制造业各行业每股净收益分布频数统计和频率统计
表2—8、2—9显示的是不同行业每股收益的不同水平的分布。在91.8%的盈利公司中,若每股收益0.6元以上为绩优股,则绩优股的比率4.7%。绩优股的行业特征也非常明显:食品行业最高,为8.4%,其后依次是通信电子行业7.9%、机械仪表设备7.3%。从表面上看其他行业最高(9.1%),但是其他行业属于主营收入不明显的“收容”类,其较高的每股收益得益于多元化经营,因此在比较时,应予以忽略。
表2—8 制造业各行业每股收益分布统计(频数)
代码
净利润分组
(元)
行业分类
小
于
-0.
6
-0.
6
~
-0.
4
-0.
4
~
-0.
2
-0.
2~
~
0.2
0.2
~
0.4
0.4
~
0.6
0.6
~
0.8
0.8
~
1.0
大
于
1.0
合
计
C0 食品、饮料 1 10 24 9 2 1 1 48 C1 纺织、服装、皮毛 1 2 1 11 27 1 2 45 C2 木材、家具 1 1 2 C3 造纸、印刷 1 8 7 16 C4 石油、化工 3 1 2 3 58 52 9 2 130 C5 橡胶、塑料 4 4 2 10C6 金属、非金属 2 6 1 32 43 10 2 96 C7 机械、仪表、设备 2 3 4 7 56 52 16 9 2 151 C8 通信、电子 4 1 14 16 12 3 1 51 C9 其他 4 5 1 1 11 合计14 6 13 13 197 231 60 19 6 1 560
表2—9 制造业各行业每股收益分布统计(频率%)
代码
净利润分组
(元)
行业分类
小
于
-0.
6
-0.
6
~
-0.
4
-0.
4
~
-0.
2
-0.
2~
~
0.2
0.2
~
0.4
0.4
~
0.6
0.6
~
0.8
0.8
~
1.0
大
于
1.0
合计
C0 食品、饮料 2.1 20.
9 50.
18.
8
4.2 2.1 2.1 100.0
C1 纺织、服装、皮毛 2.2 4.4 2.2 24.
4 60.
2.2 4.4 100.0
C2 木材、家具50.
0 50.
100.0
C3 造纸、印刷 6.3 50.
0 43.
8
100.0
C4 石油、化工 2.3 0.8 1.5 2.3 44.
6 40.
6.9 1.5 100.0
C5 橡胶、塑料40.
0 40.
20.
100.0
C6 金属、非金属 2.1 6.3 1.0 33.
3 44.
8
10.
4
2.1 100.0
C7 机械、仪表、设备 1.3 2.0 2.6 4.6 37.
1 34.
4
10.
6
6.0 1.3 100.0
C8 通信、电子7.8 2.0 27.
5 31.
4
23.
5
5.9 2.0 100.0
C9 其他36.
4 45.
5
9.1 9.1 100.0
合计 2.5 1.1 2.3 2.3 35.
2 41.
3
10.
7
3.4 1.1 0.2 100.0
(二)相关和回归分析
本案例相关和回归分析研究主要是8个财务指标间的相互关系问题。各财务指标分别说明上市公司的财务状况的某一侧面。那么这些指标之间有无关系?若有关系,是什么样的关系?通过本案例的探讨,可以帮助我们筛选主要个财务指标作为分析公司业绩变动的因素。
1.制造业业绩指标之间的关系研究
表2—10是8个财务指标的两两指标间的线性相关系数。
表2—10 制造业有关业绩指标相关系数矩阵
净资产收益率净利
润
净资
产
总资产主营业
务收入
每股
收益
每股
净资
产
股东权
益比率
净资产收益率 1
净利润0.248 1
净资产0.074 0.676 1
总资产0.052 0.626 0.929 1
主营业务收入0.072 0.705 0.838 0.910 1
每股收益0.531 0.602 0.150 0.110 0.193 1
每股净资产0.277 0.376 0.270 0.188 0.207 0.599 1
股东权益比率0.311 0.196 0.123 -0.111 -0.081 0.384 0.475 1
从相关系数矩阵看,可以得到以下几点共性的结论:
(1)主营业务收入与总资产、净资产、净利润这些总量指标显著相关,其中与总资产高度正相关。总资产比较大时,主营业务收入也倾向于比较大,而主营业务收入比较大时,净资产、净利润也比较高。这从实际情况看是可以理解的。在正常情况下,制造业的净资产除了货币资金外,主要就存货和厂房、设备等固定资产。尤其是固定资产,使生产活动的物质技术基础,其数量的多少、技术的高低决定了产品的方向及生产方式,从而决定了收入水平,并且决定了净资产的水平。
(2)虽然净资产收益率等于净利润除以净资产,但是净资产除了与净利润微弱相关外,与其他总量指标几乎不相关,也就是说,净资产收益率与资产规模、主营业务收入没有线性关系。主营业务收入水平高低并不决定盈利能力。
(3)几个相对指标之间,净资产收益率和每股收益显著正相关。在绝大多数行业中,这种相关程度均高于制造业总体的相关系数0.53。这一点告诉我们,在说明上市公司经营业绩时,净资产收益率和每股收益两个指标选择其中之一就够了。
(4)每股收益、每股净资产作为总量指标的派生指标,除每股收益与净利润外,其他均与净利润、净资产和总资产微弱相关,说明他们抽象了投入规模的不同,可载的行业、各类型的上市公司之间比较。
(5)一般地,派生指标与他们的分子指标相关系数要高于与它们的分母指标之间的相关系数。例如:净资产收益率与净利润的相关关系属要高于与净资产的相关系数。
(6)就不同行业来看,各指标之间的相关系数均有所差别,表2—11显示:不论从整个制造业还是个行业,主营业务收入、净资产与总资产高度正相关是一致的;在相对指标上产生了分化。其他行业由于主业不明,指标之间相关也很微弱。除此之外,净资产收益率与净利润和每股收益呈现不同程度的相关,机械行业表现得最明显。
表2—11 制造业上市公司行业有关指标的相关系数
行业分类主营业务收
入与总资产净资产与
总资产
净资产收益
率与净利润
净资产收益率
与每股收益
C0食品、饮料0.81 0.90 0.59 0.85 C1纺织、服装、皮毛0.83 0.86 0. 0.85 C3造纸、印刷0.85 0.88 0.55 0.92 C4石油、化工0.96 0.95 0.36 0. C5橡胶、塑料0.96 0.97 0.88 0.94
C6金属、非金属 0.88 0.96 0.46 0.90 C7机械、仪表、设备 0.86 0.85 0.27 0.52 C8通信、电子 0.92 0.93 0.37 0.65 C9其他
0.81 0.39 0.08 -0.06 合 计
0.91
0.93
0.25
0.53
2.制造业业绩指标间的回归分析
回归分析是用函数关系近似描述相关关系的表现形式,它反映的是变量之间的一种变动规律。一般地,选择哪种形式的回归模型可以通过:观察散点图;根据专业知识和经验判断。本案例中,除以上两点外,还可以根据相关系数判断,由于皮尔生积矩相关系数是对两变量线性相关程度的侧度,所以对显著相关程度以上的变量可建立线性回归函数来模拟变量间的关系,即:
ε
++++= 22110X B X B B Y
(1)主营业务收入与总资产的回归分析
由于主营业务收入与总资产的线性相关系数最大,以主营业务收入为因变量Y, 总资产为自变量X ,用560家制造业公司数据建立一元线性回归方程:
ε++=110X B B Y
Excel “工具”栏中“数据分析”的“回归”提供了相关和回归分析的结果: Multiple R ——相关系数;
R Square ——判定系数;
Adjusted R Square ——调整的判定系数 t
e
SS SS p n n ⨯----
11
1
标准误差——估计标准误xy S ; 观测值——X 、Y 变量的对数。 方差分析有关指标含义见表2—12。
表2—12
df
SS
df
SS MS =
F 值
Significance F
回归分析
回归偏差 自由度
回归偏差 平方和 回归偏差平均平方和 2
1-=
n SS SS F e R
)2,1(-n F α
残差
剩余偏差 自由度
剩余偏差 平方和 剩余偏差平均 平方和 总计
总偏差 自由度
总偏差 平方和
总偏差平均 平方和
Intercept ——截距a ;
X Variable ——一元回归的回归系数b ;
标准误差——截距a 的标准差为a σ
ˆ;回归系数b 的标准误差为b σˆ; T 统计量——对a 和b 检验时采用的统计量; P-value —— P 值;
Lower95%, Uooer95%;——截距a 或回归系数b 的95%置信峡县、置信上限;此为墨任值,若选择其他置信水平,相应的置信下限、置信上限在后面列出。
回归统计
Multiple R R Square
Adjusted R Square 标准误差 观测值
0.909813 0.82776 0.827451 65866. 560
方差分析
df SS MS F Significance F 回归分析 残 差 1 1.16E+13 1.16E+13 2681.661 2.8E-215 558 2.42E+12 4.34E+09 总 计
559 1.41E+13
主营业务收入对总资产的一元线性方程: Y = -13975+0.68X
回归系数说明, 总资产每增加1万元, 制造业主营业务收入平均增加0.68万元. 从判定系数看,在总资产对主营业务收入的影响中, 有83%可以由该线性回归方程解释, 从t 检验看,回归系数是显著的.
回归分析中, 对随机误差, 我们要求它均值为0, 并假定其服从正态分布. 从F 检验看,假定成立, 从残差分布图看, 其分布是”杂乱无章”的, 回归方程是合适的.
建立回归方程, 不仅为我们描述了主营业务收入和总资产这两个指标间的联系形式,我们利用它还可以进行预报和控制.
给定总资产, 可以对主营业务收入水平作区间估计. 本案例样本较大, 当X=X 0时,Y 的1-a 置信区间:
Y=XY S Z Y
2ˆα±
这里的S XY 是残差平均平方和MS 的平方根, 即”回归统计”表中的”标准误差”或从”方差分析”
Coeffici- 标 准 T 统 下限 上限 ents 误 差 计 量 P 值 95.0% 95.0% Intercept X1 Variable -13975 3473.233 -4.02362 6.52E-05 -20797.2 -7152.77 0.679562 0.013123 51.78476 2.8E-215 0.653786 0.705339
表资料中可以计算得到; Y
ˆ是X=X 0时回归方程得到的点估计值; 2
Z 是给定a 时的临界值。
例如, 我们想知道, 当X=20万元时, 主营业务收入95%置信区间:
点估计值是Y
ˆ =-13975+0.68×200000=122025(万元) 估计值标准误差是残差MS
2
1 =(4340000000)1/2=65879
主营业务收入置信区间:122025-1.96×65879≤Y ≤122025+1.96×65879=-7098~251148 即总资产为20亿元规模时, 估计主营业务收入的上限为25亿元,下限可能是亏损的. (2) 净利润与主营业务收入和每股收益的二元回归分析
由于指标间的关系在不同行业表现各异, 本案例仅研究了C8----通信电子行业. 通信电子行业相关系数矩阵见表2—12
表2—12 通信电子有关业绩指标相关系数矩阵
净资产 收益率
净利润
净资产
总资产
主营业务收入
每股 收益 每股净资产 股东权益比率
净资产收益率
1 净利润 0.368 1 净资产 0.121 0.698 1 总资产 0.10
2 0.752 0.938 1 主营业务收入 0.137 0.758 0.790 0.921 1 每股收益 0.5 0.70
3 0.215 0.261 0.336 1 每股净资产 0.432 0.692 0.628 0.673 0.682 0.57
4 1 股东权益比率
0.546
0.340
0.235
0.037
-0.02
0.444
0.405
1
从定性分析角度知道, 净利润与主营业务收入、总资产、净资产有密切关系,其相关系数又从定量角度给予证明. 另外, 从表中还看到, 净利润与每股收益、每股净资产也表现出了显著正相关的关系, 可能的解释在于: 财务指标不是孤立的,它们之间彼此有直接关系的影响, 同时包含了间接关系的影响. 可以用多元回归研究净利润和其他指标的关系. 但是, 在主营业务收入、总资产、净资产之间存在着高度关系, 研究净利润与多个指标的关系时它们或者可以相互替代, 或者必须删去以避免多重共线性对回归模型的影响. 因此, 这里选择主营业务收入和每股收益(它们之间的相关系数0.34,小于0.5), 建立净利润与主营业务收入和每股收益的二元线性回归方程.
计算结果如下:
回归统计
Multiple R R Square
Adjusted R Square 标准误差 观测值
0.80514 0.825 0.633594 21.934 51
方差分析
df SS MS F Significance F 回归分析 残 差 2 7.04E+09 3.52E+09 44.23029 1.29E-11 48 3.82E+09 79600902 总 计
50 1.09E+10
净利润Y 与主营业务收入X 1和每股收益X 2的线性回归方程为:
Y=3329.8+0.05X 1+35.5X 2
T 检验的P 值, 除了截距B0的P 值稍大, B1、B2的P 值均小于0.05, 回归系数是显著的. F 检验的结果证明, 模型整体也是显著的, 即净利润与主营业务收入及每股收益整体看存在线性相关关系.
复相关系数0.81, 高于净利润与主营业务收入及与每股收益的单相关系数.
偏相关系数经计算可得:
72
.0)34.0(1)76.0(134.076.07.078
.0)34.0(1)7.0(134
.07.076.022)1(222)2(1=--⨯-==--⨯-=y y r r
两个指标对净利润仍旧是正相关的关系, 比较而言, 主营业务收入(X 1)的影响更大些。
三、数据整理和分析的客观评价
(一) 案例对560家上市公司1999年报8个财务指标数据整理分析过程的优点
1.整理频数分布的时候首先借助于描述指标的判断, 使统计整理工作有了着眼点当面对纷繁的、大量的原始数据, 总体的分布及数据的分布特征根本无从得知. 因此编制数据的频数分布从那里着手呢? 根据的是什么呢? 当然是数据总体的几个主要特征值:平均数(众数、中位数)、全距、方差、偏度等. 而应用Excel 的”数据分析”,这些特征值很容易得到. 掌握了这些特征值, 对分组的组数、组距的确定才有了依据. 所以案例提出的方法, 解决了整理频数分布的可操作性问题。
2.在研究指标(变量)间关系时, 利用相关系数矩阵全面比较判断, 使进一步确定建立回归函数的形式、建立回归模型有了明确的依据。
(二) 几个有待进一步研究的问题
1.频数分布的编制没有固定的模式, 因此不是唯一的, 采用不同的组距、组限, 就有不同的分布数列. 如何评价哪一个数列最恰当或者最确切反映总体分布特征是一个值得研究的问题。
2.统计整理中的制造业行业分组所汇总的统计表, 是按照全行业整理时的组距分组的. 对不同行业来说, 这种组距、组数的划分不一定是最恰当的. 若要研究某一行业情况, 可根据其指标(变量)差异情况另行分组。
3.相关系数矩阵表描述的是一元线性相关系数, 反映的是线性关系的程度. 线性相关系数值很小, 只是说明两指标(变量)间不存在线性相关, 但是否存在非线性相关, 需进一步测定. 本案例中, 通过散点图(图5-6、图5-7)可以发现, 有些指标如主营业务收入和每股收益之间, 就存在非线性关系, 其规律有待进一步研究。
(本案例参考李晓玉编著的《统计描述与相关回归分析》案例) Coeffici- 标 准 T 统 下限 上限
ents 误 差 计 量 P 值 95.0% 95.0%
Intercept X1 Variable X2 Variable 3329.767 1534.467 2.169983 0.034988 244.51 15.017
0.0445 0.005851 8.365005 6.22E-11 0.03718 0.060709
35.4842 11.39523 3.113951 0.00311 12.57256 58.39583
