一、考试说明
本课程采用形成性考核和期末考核相结合的方式,学习过程中的形成性考核包括电大统一布置的4次平时作业及各省市电大根据教学要求自行安排的平时作业。形成性考核成绩占学期总成绩的30%。按电大考试中心的规定,形成性考核成绩不及格者不得参加期末考试。终结性考核即期末考试,期末考试成绩占学期总成绩的70%。课程总成绩按百分制记分,60分为合格。
根据电大考试中心的要求,本课程期末考试的答题时限为90分钟。
二、期末考试试题类型及结构
1.判断题:10分
2.单项选择题:12分
3.多项选择题:8分
4.简答题:20分
5.计算题:50分
期末考试形式为闭卷笔试;答题时限为90分钟;可以携带计算器。
单选、多选、判断复习内容见学习指导书及平时作业;
计算复习见下发的期末复习指导及平时作业。
三、各章复习内容
第一章 统计总论
•1.统计一词的三种含义
•2.统计学的研究对象及特点
•3.统计学的研究方法
•4.统计学的几个基本概念:总体与总体单位、标志与标志表现、变异与变量、统计指标的概念、特点及分类。
•5.国家统计兼有的职能
第二章 统计调查
•1.统计调查的概念和基本要求
•2.统计调查的种类
•3.统计调查方案的构成内容
•4.统计调查方法:普查、抽样调查、重点调查、典型调查
•5.调查误差的种类
第三章 统计整理
•1.统计整理的概念和方法
•2.统计分组的概念、种类
•3.统计分组的关键
•4.统计分组的方法:品质分组方法、变量分组的方法
•5.分配数列的概念、构成及编制方法
变量数列的编制基本步骤为:
第一步:将原始资料按数值大小依次排列。
第二步:确定变量的类型和分组方法(单项式分组或组距分组)。
第三步:确定组数和组距。当组数确定后,组距可计算得到:
组距 = 全距÷组数 全距 = 最大变量值-最小变量值。
第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)
第五步:汇总出各组的单位数(注意:不同方法确定的组限在汇总单位数时的区别),计算频率,并编制统计表。
间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。
重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。
因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。
•6.统计表的结构和种类
第四章 综合指标
•1.总量指标的概念、种类和计量单位
•2.相对指标的概念、指标数值的表现形式、相对指标的种类。相对指标包括:
结构相对指标、比例相对指标
比较相对指标、强度相对指标
动态相对指标、计划完成程度相对指标
●3.平均指标的概念、作用和种类。
算术平均数、调和平均数、众数、中位数
●4.变异指标的概念、作用和种类。
●全距、平均差、标准差、变异系数
第五章 抽样估计
一、抽样推断的概念、特点、和内容。
二、有关抽样推断的基本概念。
总体与样本、参数和统计量
样本容量、 样本个数
三、抽样误差的一般概念及影响抽样误差大小的因素。教材P178
四、抽样平均误差的含义及计算
抽样平均数平均误差 抽样成数平均误差
五、抽样极限误差的含义及计算方法。
六、.抽样误差概率度的含义及确定方法。
七、总体参数区间估计的要素及估计方法。
总体参数区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素。
总体平均数的区间估计:
总体成数的区间估计:
总体参数区间估计的方法:
抽样推断中有关的内容最后都集中在根据具体资料对总体参数(总体平均数和总体成数)进行区间估计(给定抽样误差范围,求概率保证程度;给定置信度要求,推算抽样极限误差的可能范围)的方法上。在根据资料对总体参数进行区间估计时,首先要对抽样平均误差、抽样极限误差、概率度的概念和计算方法要清楚,然后是有关区间估计的概念、方法。一般来说对总体参数进行区间估计大都遵循这样的步骤:
1.确定样本指标 样本指标有在题目资料里直接给出来,有的要通过自己计算。尤其是样本成数,一般都是自己计算。
2.计算抽样误差 有两种抽样方法,重复和不重复,所以抽样平均误差有两个公式,还要分清是平均数还是成数。
3.根据给定的概率置信度找出概率度,如概率置信度为95。45%,概率度T为2
4.根据前面计算的抽样平均误差和概率度计算抽样极限误差。然后再利用样本指标求出要估计的总体指标的上、下限,
5.根据给出的概率保证程度进行总体指标的区间估计。
根据教材上的例子,可以有两类方法:
(一)根据给定的抽样误差范围,求概率保证程度
分析步骤:
1、抽取样本,计算抽样指标。
2、根据给定的极限误差范围估计总体参数的上限和下限。
3.计算概率度。
4.查表求出概率F(t),并对总体参数作出区间估计。
(二)根据给定的概率F(t),推算抽样极限误差的可能范围
分析步骤:
1、抽取样本,计算样本指标。
2、根据给定的F(t)查表求得概率度 t 。
3.根据概率度和抽样平均误差计算极限误差。
4.计算被估计值的上、下限,对总体参数作出区间估计。
八、简单随机抽样下必要样本单位数的计算。
重复抽样条件下:
平均数抽样时必要的样本数目
成数抽样时必要的样本数目
第七章 相关分析
一、相关分析的一般概念、相关关系和函数关系的概念和相关的种类。
二、相关系数的作用、性质和计算方法。
计算相关系数的简化式:教材P276
回归分析的概念、一元线性回归方程的建立和方程参数a、b的含义。
回归直线方程
式中:y是y的估计值,a代表直线在y轴上的截距,b表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量x每增加一个单位时,因变量y的平均增加值。当b的符号为正时,表示两个变量是正相关,当b的符号为负时,表示两个变量是负相关。a、b都是待定参数,可以用最小平方法求得。
第八章 指数分析
一、指数的概念、作用和种类。
指数的作用主要有以下几个方面:
(1)综合反映复杂现象总体数量上的变动情况;
(2)分析现象总体变动中受各个因素变动的影响程度;
(3)分析社会经济现象在长时间内的发展变化趋势。
二、总指数的作用及编制方法。总指数的编制方法有两种:
综合指数:
数量指标综合指数=
表示数量指标的综合变动情况。
表示由于数量指标的变化引起的总量指标变化的绝对额。
质量指标综合指数=
表示质量指标的综合变动情况。
表示由于质量指标的变化引起的总量指标变化的绝对额。
三、平均指数:
加权算术平均数指数=
表示由于数量指标的变化引起的总量指标变化的绝对额。
加权调和平均数指数=
表示由于质量指标的变化引起总量指标变化的绝对额。
第九章 动态数列分析
一、动态数列的概念及种类
二、平均发展水平的概念和计算方法
时期数列:
间断时点数列条件下计算的两种情况:
若间断的间隔相等,则采用“首末折半法”计算。
公式为:
若间断的间隔不等,则应以间隔数为权数进行加权平均计算。
公式为:
相对指标或平均指标动态数列:
三、各种速度指标的含义和计算方法。速度指标包括:发展速度、增长量、增长速度、平均发展速度、平均增长速度和增长百分之一的绝对值。
发展速度是以相对数的形式表现的动态分析指标,它是两个不同时期发展水平指标对比的结果。说明的是报告期水平是基期水平的百分之几或若干倍。
环比发展速度和定基发展速度:
增长量是以绝对数形式表示的速度分析指标,是两个不同时期发展水平之差。公式为:增长量=报告期水平-基期水平
逐期增长量和累积增长量:
逐期增长量之和 累积增长量
平均增长量=────────=────────
逐期增长量的个数 逐期增长量的个数
增长速度是反映现象数量增长程度的动态相对指标,由增长量对比基期水平或发展速度减1(100%)而得。
四、简答题复习范围:
1.简述统计标志与标志表现的的区别并举例说明。
2.简述调查对象、调查单位与填报单位的关系、区别并举例说明。
3.抽样调查的特点及优越性。
4.简述统计分组的概念并指出统计分组可以如何分类
5.简述变量(数量标志)分组的种类及应用条件。
6.简述平均指标的特点和作用。
7.变异系数的概念及应用条件。
8. 抽样误差的概念及影响其大小的因素。
9. .相关的种类及相关系数的取值范围和判断标准。
10平均指数与综合指数的关系(可用公式表示)
11.同度量因素的概念及编制指数时如何确定同度量因数的所属时期?
12.简要说明时期数列与时点数列的概念及特点。
五、统计学原理复习(计算题)
1.某单位40名职工业务考核成绩分别为:
68 88 84 86 87 75 73 72 68
75 82 97 58 81 54 79 76 95 76
71 60 90 65 76 72 76 85 92
57 83 81 78 77 72 61 70 81
单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90
分为良,90─100分为优。
要求:
(1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并
编制一张考核成绩次数分配表;
(2)指出分组标志及类型及采用的分组方法;
(3)计算本单位职工业务考核平均成绩
(4)分析本单位职工业务考核情况。
解:(1)
成 绩 | 职工人数 | 频率(%) |
60分以下 60-70 70-80 80-90 90-100 | 3 6 15 12 4 | 7.5 15 37.5 30 10 |
合 计 | 40 | 100 |
(2)分组标志为"成绩其类型为"数量标志";分组方法为:变量分组中的开放组距式分组,组限表示方法是重叠组限;
(3)本单位职工业务考核平均成绩
(4)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态,说明大多数职工对业务知识的掌握达到了该单位的要求。
2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下:
品种 | 价格(元/斤) | 甲市场成交额(万元) | 乙市场成交量(万斤) |
甲 乙 丙 | 1.2 1.4 1.5 | 1.2 2.8 1.5 | 2 1 1 |
合计 | — | 5.5 | 4 |
解:
品种 | 价格(元) X | 甲市场 | 乙市场 | ||
成交额 | 成交量 | 成交量 | 成交额 | ||
m | m/x | f | xf | ||
甲 乙 丙 | 1.2 1.4 1.5 | 1.2 2.8 1.5 | 1 2 1 | 2 1 1 | 2.4 1.4 1.5 |
合计 | — | 5.5 | 4 | 4 | 5.3 |
甲市场平均价格(元/斤)
乙市场平均价格(元/斤)
说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场
平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。
3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,
标准差为9.6件;乙组工人日产量资料如下:
日产量(件) | 工人数(人) |
15 25 35 45 | 15 38 34 13 |
⑵比较甲、乙两生产小组哪个组的日产量更有代表性?
解:(1)
(件)
(件)
(2)利用标准差系数进行判断:
因为0.305 >0.267
故甲组工人的平均日产量更有代表性。
4.某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其月平均产量水平,得每人平均产量560件,标准差32.45
要求:(1)计算抽样平均误差(重复与不重复);
(2)以95%的概率(z=1.96)估计该厂工人的月平均产量的区间;
(3)以同样的概率估计该厂工人总产量的区间。
解: (1)
重复抽样:
不重复抽样:
(2)抽样极限误差= 1.96×4.59 =9件
月平均产量的区间: 下限:△=560-9=551件
上限:△=560+9=569件
(3)总产量的区间:(551×1500 826500件; 569×1500 853500件)
5.采用简单随机重复抽样的方法,在2000件产品中抽查200件,其中合格品190件.
要求:(1)计算合格品率及其抽样平均误差
(2)以95.45%的概率保证程度(z=2)对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其概率保证程度是多少?
解:(1)样本合格率
p = n1/n = 190/200 = 95%
抽样平均误差= 1.54%
(2)抽样极限误差Δp=zμp = 2×1.54% = 3.08%
下限:△p=95%-3.08% = 91.92%
上限:△p=95%+3.08% = 98.08%
则:总体合格品率区间:(91.92% 98.08%)
总体合格品数量区间(91.92%×2000=1838件 98.08%×2000=1962件)
(3)当极限误差为2.31%时,则概率保证程度为86.% (z=Δ/μ)
6. 某企业上半年产品产量与单位成本资料如下:
月 份 | 产量(千件) | 单位成本(元) |
1 2 3 4 5 6 | 2 3 4 3 4 5 | 73 72 71 73 69 68 |
要求:(1)计算相关系数,说明两个变量相关的密切程度。
(2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少?
(3)假定产量为6000件时,单位成本为多少元?
解:计算相关系数时,两个变量都是随机变量,
不须区分自变量和因变量。考虑到要配和合回归方程,
所以这里设产量为自变量(x),单位成本为因变量(y)
月 份
n | 产量(千件) x | 单位成本(元) y | xy | ||
1 2 3 4 5 6 | 2 3 4 3 4 5 | 73 72 71 73 69 68 | 4 9 16 9 16 25 | 5329 5184 5041 5329 4761 4624 | 146 216 284 219 276 340 |
合 计 | 21 | 426 | 79 | 30268 | 1481 |
(1)计算相关系数:
说明产量和单位成本之间存在高度负相关。
(2)配合回归方程 y=a+bx
=-1.82
=77.37
回归方程为:y=77.37-1.82x
产量每增加1000件时,单位成本平均减少1.82元
(3)当产量为6000件时,即x=6,代入回归方程:
y=77.37-1.82×6=66.45(元)
7.根据企业产品销售额(万元)和销售利润率(%)资料计算出如下数据:
n=7 =10 =31.1 2=535500 2=174.15 =9318
要求: (1) 确定以利润率为因变量的直线回归方程.
(2)解释式中回归系数的经济含义.
(3)当销售额为500万元时,利润率为多少?
解:(1)配合直线回归方程:y=a+bx
b= = =0.0365
a== =-5.41
则回归直线方程为: yc=-5.41+0.0365x
(2)回归系数b的经济意义:当销售额每增加一万元,销售利润率增加0.0365%
(3)计算预测值:
当x=500万元时 yc=-5.41+0.0365=12.8%
8. 某商店两种商品的销售资料如下:
商品 | 单位 | 销售量 | 单价(元) | ||
基期 | 计算期 | 基期 | 计算期 | ||
甲 乙 | 件 公斤 | 50 150 | 60 160 | 8 12 | 10 14 |
(2)计算两种商品销售量总指数及由于销售量变动影响销售额的绝对额;
(3)计算两种商品销售价格总指数及由于价格变动影响销售额的绝对额。
解:(1)商品销售额指数=
销售额变动的绝对额:元
(2)两种商品销售量总指数=
销售量变动影响销售额的绝对额元
(3)商品销售价格总指数=
价格变动影响销售额的绝对额:元
9.某商店两种商品的销售额和销售价格的变化情况如下:
商品 | 单位 | 销售额(万元) | 1996年比1995年 销售价格提高(%) | |
1995年 | 1996年 | |||
甲 乙 | 米 件 | 120 40 | 130 36 | 10 12 |
(2)计算销售量总指数,计算由于销售量变动,消费者增加(减少)的支
出金额。
解:(1)商品销售价格总指数=
由于价格变动对销售额的影响绝对额:
万元
(2))计算销售量总指数:
商品销售价格总指数=
而从资料和前面的计算中得知:
所以:商品销售量总指数=,
由于销售量变动,消费者增加减少的支出金额: -
10.某地区1984年平均人口数为150万人,1995年人口变动情况如下:
月份 | 1 | 3 | 6 | 9 | 次年1月 |
月初人数 | 102 | 185 | 190 | 192 | 184 |
(2)1984-1995年该地区人口的平均增长速度.
解:(1)1995年平均人口数
=181.38万人
(2)1984-1995年该地区人口的平均增长速度:
11.某地区1995—1999年粮食产量资料如下:
年份 | 1995年 | 1996年 | 1997年 | 1998年 | 1999年 |
粮食产量(万斤) | 434 | 472 | 516 | 584 | 618 |
(2)计算1995年-1999年该地区粮食产量的年平均增长量和粮食产量
的年平均发展速度;
(3)如果从1999年以后该地区的粮食产量按8%的增长速度发展,
2005年该地区的粮食产量将达到什么水平?
解:(1)
年 份 | 1995年 | 1996年 | 1997年 | 1998年 | 1999年 |
粮食产量(万斤) 环比发展速度 定基发展速度 逐期增长量 累积增长量 | 434 - - - - | 472 108.76 108.76 38 38 | 516 109.32 118. 44 82 | 584 113.18 134.56 68 150 | 618 105.82 142.40 34 184 |
(2)平均发展速度
(3)=980.69(万斤)
12.
年 份 | 1995年 | 1996年 | 1997年 | 1998年 | 1999年 |
粮食产量(万斤) 环比发展速度
逐期增长量
| 434 - - -
| 108.76
|
44
|
68
| 105.82
|
(2)计算1995年-1999年该地区粮食产量的年平均增长量和粮食产量
的年平均发展速度;
(3)如果从1999年以后该地区的粮食产量按8%的增长速度发展,2005年该地区的粮食产量将达到什么水平?
(做法见上题)