
一、试验目的与要求
(1)熟悉间接统计数据的搜集方法、搜集途径,能熟练地通过网络搜集间接数据;
(2)掌握直接数据的搜集,特别是熟悉一项调查工作的各个环节,包括制定调查方案、选取抽样框、设计问卷表、抽取样本、具体的调查和数据搜集过程。
(3)掌握不同类型的调查资料进行整理的方法,包括数据的审核、问卷的编码方法、问卷的数据录入方法、对数据进行分组。
二、统计数据的搜集
(1)间接数据的搜集
二手数据主要是公开出版的或者公开报道的数据。公开出版的刊物有《中国统计年鉴》、《中国统计摘要》、《中国社会统计年鉴》等,搜集二手数据还可以通过期刊、报纸、杂志等。现在,常通过网络的方式搜集数据。
常用的国内网站如表1-1所示。
表1-1 常用国内网站
| 组织机构 | 网址 | 简介 |
| 中华人民共和国国家统计局 | 提供全国的月度数据、季度数据、年度数据、普查数据、各种专题数据、部门数据和国际数据等。设有专门的国家统计数据库。 | |
| 中国经济信息网 | 提供各种经济信息,包括综合篇、行业篇、区域篇等。设有中国经济统计数据库、中外经济动态全文库、中国权威经济文库、中经网产业数据库等十余个专题数据库。 | |
| 中国知网 | 提供期刊、会议、报纸、硕博论文的查询等,还可查询各种年鉴、词典。设有专门的CNKI中国经济社会发展统计数据库,包括各种统计年鉴、区域发展数据、产业发展数据、行业数据分析、国际数据分析等。 | |
| 中国人口信息网 | 提供有关人口方面的统计数据,包括人口抽样调查原始数据、中国人口数据表、世界人口数据等。(一般无法访问) | |
| 各地方统计局 | 提供各地方统计年鉴、统计公报等统计数据。 | |
| 经济学家论坛 | 分为经济一区、经济二区、统计数据区、数据处理区等,可获得各种统计年鉴及相关数据。 | |
| 经济论坛 | 分为经济学论坛、计量经济与统计论坛、金融投资论坛等,可获得各种统计年鉴及相关数据。 |
进入国家统计局网站,单击“统计数据”栏目,如图1-1所示;根据需要选择需要的数据类型进入,即可查询相关数据。
图1-1 国家统计局“统计数据”页面
(2)直接数据的搜集
统计数据的直接来源主要有两个渠道:一是调查或观察,二是实验。统计调查是取得社会经济数据的主要来源。它主要包括抽样调查、普查、统计报表等调查方式。主要讲解抽样调查取得直接数据。
抽取样本:
例1-1:利用excel,按照简单随机重复抽样的方法从100人中抽取20人。
①作出数据表,输入总体各单位的编号(利用“填充”、“序列”功能输入1-100号);
②单击“数据”→“数据分析”选项;
图1-2 选择“数据”中的“数据分析”
③单击“抽样”选项,在“抽样”对话框的“输入区域”中输入A1:J10,在“随机”模式下的“样本数”框中输入20,在“输出区域”框中输入输出表左上角的单元格行列号(此单元格为空单元格,其右下角为空)。
图1-3 从列表中选“抽样”
图1-4 填写“抽样”对话框
图1-5 抽样结果
三、统计数据的整理
(1)数据的预处理
①数据的编码及录入
②数据的录入
(2)数据的审核与筛选
数据的审核包括完整性审核和准确性审核。审核数据准确性的方法主要有逻辑检查和计算检查。此外,还要对数据的时效性进行审核,应尽可能使用最新的统计数据。
数据筛选包括:①将某些不符合要求的数据或有明显错误的数据予以剔除;②将某些符合特定条件的数据筛选出来。
例1-2:各省在食品、衣着、居住等方面的人均现金消费支出数据如表1-2所示。
表1-2 人均现金消费数据
| 地区 | 食品 | 衣着 | 居住 | 交通通信 | 文教娱乐 | 医疗保健 |
| 重庆 | 5847 | 2056 | 1205 | 1718 | 1474 | 1050 |
| 四川 | 5571 | 1483 | 1226 | 1757 | 1369 | 735 |
| 贵州 | 4565 | 1209 | 1102 | 1395 | 1331 | 578 |
| 云南 | 4802 | 1587 | 827 | 1905 | 1350 | 822 |
| 5184 | 1261 | 781 | 1278 | 514 | 424 | |
| 陕西 | 5040 | 1673 | 1193 | 1502 | 1857 | 1100 |
| 甘肃 | 4182 | 1470 | 1139 | 12 | 1158 | 874 |
| 青海 | 4260 | 1394 | 1055 | 1293 | 967 | 854 |
| 宁夏 | 4483 | 1701 | 1247 | 1637 | 1441 | 978 |
| 4537 | 1715 | 888 | 1377 | 1122 | 912 |
图1-6 选择“自动筛选”
如果筛选出衣着消费支出中最高的前三个省市,可点击衣着所在列的下拉箭头中的“前10个”,在选项中输入“3”,如图1-7所示。
图1-7 “自动筛选”-“10个最大的值选项”
图1-8 填写“自动筛选”对话框
图1-9 筛选结果
②高级筛选
如果所设定的条件比较多,可以使用“高级筛选”命令。
图1-10 填写“高级筛选”对话框
图1-11 筛选结果
③数据的排序
例1-3:将例1-2中的数据,按照人均衣着现金消费支出按照从小到大的顺序排序。
a、自动排序
图1-12 “排序”界面
图1-13 排序结果
b、“数据”→“数据分析”→“排位与百分比排位”
图1-14 选择“排位与百分比排位”选项
图1-15 填写“排位与百分比排位”对话框
图1-16 “排位与百分比排位”结果
(2)数据的整理
例1-4:某教师所授课程的学生来自多个专业,数据如表1-3所示,将学生按专业分组,编制频数分布表,绘制柱状图。
表1-3 学生所属专业原始数据表
| 市场营销 | 商务策划管理 | 工商管理 | 商务策划管理 | 市场营销 |
| 工商管理 | 商务策划管理 | 商务策划管理 | 商务策划管理 | 旅游管理 |
| 市场营销 | 商务策划管理 | 市场营销 | 商务策划管理 | 市场营销 |
| 财务管理 | 市场营销 | 财务管理 | 商务策划管理 | 市场营销 |
| 商务策划管理 | 市场营销 | 工商管理 | 工商管理 | 工商管理 |
| 旅游管理 | 市场营销 | 商务策划管理 | 工商管理 | 商务策划管理 |
| 商务策划管理 | 财务管理 | 市场营销 | 工商管理 | 商务策划管理 |
| 市场营销 | 旅游管理 | 财务管理 | 财务管理 | 财务管理 |
| 商务策划管理 | 财务管理 | 工商管理 | 旅游管理 | 财务管理 |
| 商务策划管理 | 财务管理 | 工商管理 | 财务管理 | 财务管理 |
图1-17 原始数据及分组
②选用COUNTIF函数。
图1-18 频数分布表
③绘制柱状图。
图1-19 不同专业人数分布图
例1-5:某生产车间30名工人的日产零件数如表1-4所示,试以组距为10进行等距式分组,第一组为100-110;并绘制直方图。
表1-4 某生产车间30名工人日餐零件统计表
| 148 | 116 | 128 | 125 | 129 | 140 | 109 | 123 | 137 | 119 |
| 127 | 132 | 114 | 107 | 124 | 120 | 135 | 108 | 113 | 130 |
| 110 | 129 | 132 | 123 | 118 | 104 | 123 | 124 | 140 | 107 |
①确定分组上限,如图1-20所示;
图1-20 确定分组上限
②填写FREQUENCY函数,如图1-21所示;
图1-21 填写FREQUENCY函数
③由于上述公式是数组公式,按【ctrl+shift+enter三键】结束公式,输出的结果如图1-22所示。
图1-22 分组结果
b:利用数据分析→直方图
图1-23 数据分析→直方图方式结果输出
c:绘制直方图。
图1-24 工人加工零件数直方图
四、练习
(1)某教师要了解研究生课程“社会科学研究方法”教学情况,对学生进行了调查,其中四个问题为:
a如果采取如下教学方式,你最赞同的是( )
①以一个课题为基础,贯穿所有内容;
②以小组为单位进行讨论,各组在上台介绍讨论过程及结果;
③位置本学期的教学方式;
④其他
b你认为本课程的最佳学时为( )
①1②3③4④4⑤其他
c你本科所学专业属于( )
①经济学 ②管理学 ③工学 ④理学 ⑤其他
d你的性别为( )
①男 ②女
得到的调查原始数据如表1-5所示。
表1-5 调查原始数据表
| 问卷号 | 问题a | 问题b | 问题c | 问题d | 问卷号 | 问题a | 问题b | 问题c | 问题d |
| 1 | 2 | 2 | 1 | 1 | 17 | 1 | 2 | 1 | 1 |
| 2 | 1 | 2 | 2 | 1 | 18 | 1 | 2 | 1 | 1 |
| 3 | 3 | 2 | 4 | 2 | 19 | 3 | 2 | 4 | 1 |
| 4 | 3 | 2 | 1 | 2 | 20 | 1 | 1 | 2 | 1 |
| 5 | 3 | 2 | 2 | 2 | 21 | 2 | 3 | 1 | 2 |
| 6 | 1 | 3 | 1 | 1 | 22 | 1 | 5 | 1 | 2 |
| 7 | 3 | 2 | 4 | 1 | 23 | 2 | 2 | 1 | 1 |
| 8 | 1 | 2 | 2 | 1 | 24 | 1 | 3 | 1 | 1 |
| 9 | 1 | 2 | 2 | 1 | 25 | 1 | 1 | 1 | 2 |
| 10 | 1 | 4 | 1 | 1 | 26 | 2 | 2 | 1 | 2 |
| 11 | 3 | 2 | 1 | 1 | 27 | 4 | 3 | 1 | 1 |
| 12 | 1 | 4 | 4 | 1 | 28 | 1 | 2 | 1 | 2 |
| 13 | 1 | 2 | 1 | 1 | 29 | 2 | 4 | 4 | 1 |
| 14 | 3 | 4 | 1 | 1 | 30 | 1 | 2 | 1 | 1 |
| 15 | 1 | 2 | 1 | 1 | 31 | 1 | 2 | 1 | 2 |
| 16 | 1 | 4 | 1 | 1 |
②筛选出认为本课程的最佳学时为32学时的女学生;
③从所有学生中堆积抽取10为,并指出其相应回答。
(2)某国交通部采集了每1000名驾驶执照发生死亡事故的车祸次数和有驾驶执照的司机中21岁以下的所占比例的数据,样本由42个城市组成,在1年间采集的数据如表1-6所示。
表1-6 样本数据表
| 序号 | 21岁以下所占比例(%) | 每千个驾驶执照中发生车祸次数 | 序号 | 21岁以下所占比例(%) | 每千个驾驶执照中发生车祸次数 |
| 1 | 13 | 2.962 | 22 | 17 | 4.100 |
| 2 | 12 | 0.708 | 23 | 8 | 2.190 |
| 3 | 8 | 0.885 | 24 | 16 | 3.623 |
| 4 | 12 | 1.652 | 25 | 15 | 2.623 |
| 5 | 11 | 2.091 | 26 | 9 | 0.835 |
| 6 | 17 | 2.627 | 27 | 8 | 0.820 |
| 7 | 18 | 3.830 | 28 | 14 | 2.0 |
| 8 | 8 | 0.368 | 29 | 8 | 1.267 |
| 9 | 13 | 1.142 | 30 | 15 | 3.224 |
| 10 | 8 | 0.5 | 31 | 10 | 1.014 |
| 11 | 9 | 1.082 | 32 | 10 | 0.493 |
| 12 | 16 | 2.801 | 33 | 14 | 1.443 |
| 13 | 12 | 1.405 | 34 | 18 | 3.614 |
| 14 | 9 | 1.433 | 35 | 10 | 1.926 |
| 15 | 10 | 0.039 | 36 | 14 | 1.3 |
| 16 | 9 | 0.338 | 37 | 16 | 2.943 |
| 17 | 11 | 1.849 | 38 | 12 | 1.913 |
| 18 | 12 | 2.246 | 39 | 15 | 2.814 |
| 19 | 14 | 2.885 | 40 | 13 | 2.634 |
| 20 | 14 | 2.352 | 41 | 9 | 0.926 |
| 21 | 11 | 1.294 | 42 | 17 | 3.256 |
