最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

聚类分析——步骤

来源:动视网 责编:小OO 时间:2025-09-27 21:58:08
文档

聚类分析——步骤

《聚类分析》实验报告实验项目:聚类分析实验地点:实验室名称:学院:年级专业班:学生姓名:学号:完成时间:教师评语:开课时间:至学年第学期成绩教师签名批阅日期一、实验目的1、掌握SPSS17.0或STATISTICA6.0软件中相关操作内容;2、掌握聚类分析的基本步骤;3、了解聚类分析的作用;4、熟习虚拟变量的用法;5、利用得到的结果解决实际问题。二、实验原理利用聚类分析解决经济与社会中的现实问题。三、实验内容1.数据搜集;2.数据组织与录入保存;3.利用SPSS17.0或STATISTICA6
推荐度:
导读《聚类分析》实验报告实验项目:聚类分析实验地点:实验室名称:学院:年级专业班:学生姓名:学号:完成时间:教师评语:开课时间:至学年第学期成绩教师签名批阅日期一、实验目的1、掌握SPSS17.0或STATISTICA6.0软件中相关操作内容;2、掌握聚类分析的基本步骤;3、了解聚类分析的作用;4、熟习虚拟变量的用法;5、利用得到的结果解决实际问题。二、实验原理利用聚类分析解决经济与社会中的现实问题。三、实验内容1.数据搜集;2.数据组织与录入保存;3.利用SPSS17.0或STATISTICA6
 

《聚类分析》

实 验 报 告

实验项目:       聚类分析                         

实验地点:              实验室名称:              

学    院:             年级专业班:               

学生姓名:             学号:                     

完成时间:                                        

教师评语:                                        

                                                    

                                                    

                                                    

开课时间:          至          学年第        学期

成    绩                                 
教师签名
批阅日期
一、实验目的

1、掌握SPSS17.0或STATISTICA6.0软件中相关操作内容;

2、掌握聚类分析的基本步骤;

3、了解聚类分析的作用;

4、熟习虚拟变量的用法;

5、利用得到的结果解决实际问题。

二、实验原理

利用聚类分析解决经济与社会中的现实问题。

三、实验内容

1.数据搜集;

2.数据组织与录入保存;

3.利用SPSS17.0或STATISTICA6.0软件进行聚类分析;

4.对得到的结果进行相应的分析。

四、使用仪器、材料

SPSS

五、实验步骤

六、实验原始记录及其处理(数据、图表、计算等)

表4-2 各监测点环境要素的超标倍数

监测点序号超标倍数监测点序号超标倍数
大气地表水土壤大气地表水土壤
13.662.542.211112.533.281.48
23.342.272.12123.021.581.43
33.295.711.90130.1.101.04
46.1.301.90143.661.321.17
53.1.311.52153.172.801.15
68.651.073.50163.841.081.01
74.556.164.25173.961.361.09
84.755.602.75183.421.681.25
95.1.391.23193.660.1.10
104.053.452.51201.180.781.24
七、实验结果及分析
聚类分析

一、背景介绍

我国经济飞速发展,相应的也使我国环境受到一定的影响,而工厂排放的废水、废气等物质对我国环境的污染尤其严重。以下数据是在在某工业区设有20个监测点,对该工业区的大气、地表水和土壤等环境要素进行监测,得到各种环境要素代表性污染物的日平均浓度,将其分别除以相应的环境质量标准(消除量纲不同的影响),得到的超标倍数。通过聚类分析,研究出哪些监测点可以并为一类,以减少开支。

表4-2 各监测点环境要素的超标倍数

监测点序号超标倍数监测点序号超标倍数
大气地表水土壤大气地表水土壤
13.662.542.211112.533.281.48
23.342.272.12123.021.581.43
33.295.711.90130.1.101.04
46.1.301.90143.661.321.17
53.1.311.52153.172.801.15
68.651.073.50163.841.081.01
74.556.164.25173.961.361.09
84.755.602.75183.421.681.25
95.1.391.23193.660.1.10
104.053.452.51201.180.781.24
二、聚类分析步骤

1、打开SPSS,并定义变量,如图:

将数据录入到SPSS中,如图:

2、进行聚类分析

(1)依次点击分析→分类→系统聚类,打开系统聚类分对话框,如图:

(2)将“大气”、“地表水”、“土壤”选为变量,将“监测点序号”选为标注个案,如图:

(3)然后点击“统计量”,如图选择:

(4)点击“继续”,选择“绘制”,如图选择:

(5)点击“继续”,选择“方法”,如图选择:

(6)点击“继续”,选择“保存”如图:

(7)选择“继续”,点击“确定”,即得结果

三、得到结果

表1:

Proximity Matrix
Case Squared Euclidean Distance 
1:1       2:2       3:3       4:4       5:5       6:6       7:7       8:8       9:9       10:10      11:11      12:12      13:13      14:14      15:15      16:16      17:17      18:18      19:19      20:20      
1:1       .000.0513.6612.0081.1466.65910.0273.8302.445.42812.8021.1623.8591.9041.4962.5922.1051.4462.5283.220
2:2       .051.0004.2042.042.8297.21411.3194.6902.270.75813.686.7913.0761.4851.3062.1091.7041.0902.0122.474
3:3       3.6614.204.0008.5097.01615.1657.3721.2518.1312.35115.2376.29.4497.4483.6858.5627.5306.2278.9719.739
4:4       2.0082.0428.509.0001.3313.90415.9907.937.6623.1116.8582.2976.4182.0283.3322.2181.9292.1632.2235.172
5:5       1.146.8297.0161.331.0008.46717.8278.488.7162.86012.679.1511.911.1651.031.351.238.175.2951.312
6:6       6.6597.21415.1653.9048.467.00012.33610.2087.7786.4449.20910.37517.46510.73812.66111.43410.79010.74911.15015.020
7:7       10.02711.3197.37215.99017.82712.336.0002.99219.66.47922.36817.824.45320.44716.52622.52920.88318.72422.52623.436
8:8       3.8304.6901.2517.9378.48810.2082.992.0009.3551.76613.1238.33813.3879.7836.39511.1479.9108.52311.42612.979
9:9       2.4452.2708.131.662.7167.77819.69.355.0004.0938.0151.3134.255.7601.826.733.590.955.8633.494
10:10      .428.7582.3513.1112.8606.4446.4791.7664.093.00012.2702.8766.4593.9072.6304.8494.1083.1864.8595.806
11:11      12.80213.68615.2376.85812.6799.20922.36813.1238.01512.270.00014.72723.34613.39713.50313.42612.62113.54714.11321.794
12:12      1.162.7916.22.297.15110.37517.88.3381.3132.87614.727.0001.134.172.625.415.299.069.368.783
13:13      3.8593.0769.4496.4181.91117.46524.45313.3874.2556.45923.3461.134.0001.4211.9981.5541.6981.3461.403.131
14:14      1.9041.4857.4482.028.16510.73820.4479.783.7603.90713.397.1721.421.000.804.058.022.062.0711.041
15:15      1.4961.3063.6853.3321.03112.66116.5266.3951.8262.63013.503.6251.998.804.0001.129.825.4611.3172.039
16:16      2.5922.1098.5622.218.35111.43422.52911.147.7334.84913.426.4151.554.0581.129.000.038.226.0281.172
17:17      2.1051.7047.5301.929.23810.79020.8839.910.5904.10812.621.2991.698.022.825.038.000.113.0911.318
18:18      1.4461.0906.2272.163.17510.74918.7248.523.9553.18613.547.0691.346.062.461.226.113.000.2561.044
19:19      2.5282.0128.9712.223.29511.15022.52611.426.8634.85914.113.3681.403.0711.317.028.091.256.000.962
20:20      3.2202.4749.7395.1721.31215.02023.43612.9793.4945.80621.794.783.1311.0412.0391.1721.3181.044.962.000
This is a dissimilarity matrix
表2:

Agglomeration Schedule
StageCluster CombinedCoefficientsStage Cluster First AppearsNext Stage
Cluster 1Cluster 2Cluster 1Cluster 2
11417.011005
21619.025005
312.0510010
41218.085007
51416.137128
61320.2030013
7512.300048
8514.6157512
949.9460014
101101.3323014
11381.9580015
125152.6668013
135134.58112617
14147.41110917
153710.65711018
1661115.2620018
171520.108141319
183633.484151619
191357.00017180
表3:

Cluster Membership
Case11 Clusters10 Clusters9 Clusters
1:1       111
2:2       111
3:3       222
4:4       333
5:5       444
6:6       555
7:7       666
8:8       772
9:9       333
10:10      811
11:11      987
12:12      444
13:13      1098
14:14      444
15:15      11109
16:16      444
17:17      444
18:18      444
19:19      444
20:20      1098
树状图:

由树状图可以看出,监测点1、2、5、12、14、16、17、18、19为一类;监测点10单独为一类;监测点15单独为一类;监测点7单独为一类;监测点8单独为一类;监测点3单独为一类;监测点4、9为一类;监测点13、20为一类;监测点6单独为一类;监测点11单独为一类。每一类的观测效果是差不多的,因此,可以将在每一类中再选取某一监测点来进行监测。这样,可以减轻人力、物力的投入,并同时减少开支。

文档

聚类分析——步骤

《聚类分析》实验报告实验项目:聚类分析实验地点:实验室名称:学院:年级专业班:学生姓名:学号:完成时间:教师评语:开课时间:至学年第学期成绩教师签名批阅日期一、实验目的1、掌握SPSS17.0或STATISTICA6.0软件中相关操作内容;2、掌握聚类分析的基本步骤;3、了解聚类分析的作用;4、熟习虚拟变量的用法;5、利用得到的结果解决实际问题。二、实验原理利用聚类分析解决经济与社会中的现实问题。三、实验内容1.数据搜集;2.数据组织与录入保存;3.利用SPSS17.0或STATISTICA6
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top