
所属课程名称 应用多元统计分析
实验时间 2016~2017学年第 二 学期
所在实验室 学14408
班 级 地理信息科学152班
学 号 201518100225
姓 名 俞春晖
指导教师 黄敏
实验报告2
判别分析(综合性实验)
日期: 2017 年 月 日
一、实验概述: | ||||
| 【实验目的及要求】 配合理论教学,培养学生的动手能力,要求学生熟悉SPSS统计软件的运行环境,掌握用SPSS软件进行判别分析,主要包括距离判别,Bayesian判别,Fisher判别,并且要学会对所获得的结果进行分析以及给出统计解释。 【基本原理】 (1)距离判别的基本思想和基本过程; (2)Bayesian判别的基本思想和基本过程; (3)Fisher判别的基本思想和基本过程。 【实施环境】(软件操作) 利用spss19.0的判别分析过程:Analyze—Classify--Discriminant | ||||
| 二、实验内容: | ||||
| 【项目内容及要求】 1.某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。 销售情况 | 产品序号 | 销售价格 | 口味评分 | 信任度评分 |
| 畅销 | 1 | 2.2 | 5 | 8 |
| 2 | 2.5 | 6 | 7 | |
| 3 | 3.0 | 3 | 9 | |
| 4 | 3.2 | 8 | 6 | |
| 平销 | 5 | 2.8 | 7 | 6 |
| 6 | 3.5 | 8 | 7 | |
| 7 | 4.8 | 9 | 8 | |
| 滞销 | 8 | 1.7 | 3 | 4 |
| 9 | 2.2 | 4 | 2 | |
| 10 | 2.7 | 4 | 3 |
现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。
【实验过程和结论】(给出操作步骤、数据、程序以及菜单路径,还有结果和分析结论)
将数据输入软件,点击工具栏“分析-分类-判别”
将各个指标分别导入到分组变量和自变量中,并点击右侧第一行的统计量选项
在跳出的窗口中选择fisher‘s函数。
并在分类按钮调出来的悬浮框中勾选个案结果。
点击continue
表1:
| 分类函数系数 | |||
| 销售情况 | |||
| 1 | 2 | 3 | |
| 销售价格 | -11.6 | -10.707 | -2.194 |
| 口味评分 | 12.297 | 13.361 | 4.960 |
| 信任度评分 | 16.761 | 17.086 | 6.447 |
| (常量) | -81.843 | -94.536 | -17.449 |
| Fisher 的线性判别式函数 | |||
由表1可得贝叶斯判别函数为:
y1=-81.843-11.6x1+12.297x2+16.671x3
y2=-94.536-10.707x1+13.361x2+17.086x3
y3=-17.449-2.194x1+4.960x2+6.447x3
由表2可知产品序号为4和5的产品判断有误。
(2)由表2可知销售情况为:平销
2. 银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄()、受教育程度()、现在所从事工作的年数()、未变更住址的年数()、收入()、负债收入比例()、信用卡债务()、其它债务()等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据,根据样本资料分别用距离判别法、Bayes判别法和Fisher判别法建立判别函数和判别规则。某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。
| 目前信用好坏 | 客户序号 | ||||||||
| 已履行还贷责任 | 1 | 23 | 1 | 7 | 2 | 31 | 6.60 | 0.34 | 1.71 |
| 2 | 34 | 1 | 17 | 3 | 59 | 8.00 | 1.81 | 2.91 | |
| 3 | 42 | 2 | 7 | 23 | 41 | 4.60 | 0.94 | .94 | |
| 4 | 39 | 1 | 19 | 5 | 48 | 13.10 | 1.93 | 4.36 | |
| 5 | 35 | 1 | 9 | 1 | 34 | 5.00 | 0.40 | 1.30 | |
| 未履行还贷责任 | 6 | 37 | 1 | 1 | 3 | 24 | 15.10 | 1.80 | 1.82 |
| 7 | 29 | 1 | 13 | 1 | 42 | 7.40 | 1.46 | 1.65 | |
| 8 | 32 | 2 | 11 | 6 | 75 | 23.30 | 7.76 | 9.72 | |
| 9 | 28 | 2 | 2 | 3 | 23 | 6.40 | 0.19 | 1.29 | |
| 10 | 26 | 1 | 4 | 3 | 27 | 10.50 | 2.47 | .36 |
将数据输入软件,点击工具栏“分析-分类-判别”,将各个指标分别导入到分组变量和自变量中,并点击右侧第一行的统计量选项,在跳出的窗口中选择fisher‘s函数。并在分类按钮调出来的悬浮框中勾选“个案结果”。最后点击continue
表1:
| 分类函数系数 | ||
| 目前信用好坏 | ||
| 1 | 2 | |
| x1 | .340 | .184 |
| x2 | 94.070 | 126.660 |
| x3 | 1.033 | 1.874 |
| x4 | -4.943 | -6.681 |
| x5 | 2.969 | 3.086 |
| x6 | 13.723 | 17.182 |
| x7 | -10.994 | -7.133 |
| x8 | -37.504 | -49.116 |
| (常量) | -118.693 | -171.296 |
| Fisher 的线性判别式函数 | ||
y1=-118.693+0.34x1+94.070x2+1.033x3-4.943x4+2.969x5+13.723x6-10.994x7-37.504x8 y2=-171.296+0.184x1+126.660x2+1.874x3-6.681x4+3.086x5+17.182x6-7.133x7-49.116x8
| 典型判别式函数系数 | |
| 函数 | |
| 1 | |
| x1 | -.032 |
| x2 | 6.687 |
| x3 | .173 |
| x4 | -.357 |
| x5 | .024 |
| x6 | .710 |
| x7 | .792 |
| x8 | -2.383 |
| (常量) | -10.794 |
| 非标准化系数 | |
y=-10.794-0.032x1+6.687x2+0.173x3-0.357x4+0.24x5+0.71x6+0.792x7-2.383x8
| 组质心处的函数 | |
| 目前信用好坏 | 函数 |
| 1 | |
| 1 | -2.437 |
| 2 | 2.437 |
| 在组均值处评估的非标准化典型判别式函数 | |
(2)1:由表3可得该客户已经履行还贷责任
2:将数据带入贝叶斯判别Y1 Y2中发现Y1>Y2所以应为还贷状态为1,已履行还贷责任。
3:将数据带入费希尔判别函数中发现y比较接近-2.437,故为1,已履行还贷责任。
3. 从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行四项生化指标的化验:血清铜蛋白、蓝色反应、尿吲哚乙酸和中性硫化物,数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。
| 类别 | 病人序号 | ||||
| 胃癌患者 | 1 | 228 | 134 | 20 | 11 |
| 2 | 245 | 134 | 10 | 40 | |
| 3 | 200 | 167 | 12 | 27 | |
| 4 | 170 | 150 | 7 | 8 | |
| 5 | 100 | 167 | 20 | 14 | |
| 胃炎患者 萎缩性 | 6 | 225 | 125 | 7 | 14 |
| 7 | 130 | 100 | 6 | 12 | |
| 8 | 150 | 117 | 7 | 6 | |
| 9 | 120 | 133 | 10 | 26 | |
| 10 | 160 | 100 | 5 | 10 | |
| 非胃炎患者 | 11 | 185 | 115 | 5 | 19 |
| 12 | 170 | 125 | 6 | 4 | |
| 13 | 165 | 142 | 5 | 3 | |
| 14 | 135 | 108 | 2 | 12 | |
| 15 | 100 | 117 | 7 | 2 |
将数据输入软件,点击工具栏“分析-分类-判别”
将各个指标分别导入到分组变量和自变量中,并点击右侧第一行的统计量选项
在跳出的窗口中选择fisher’s函数。
并在分类按钮调出来的悬浮框中勾选“个案结果”。
点击continue
| 分类函数系数 | |||
| 类别 | |||
| 1 | 2 | 3 | |
| x1 | .1 | .130 | .130 |
| x2 | .753 | .595 | .637 |
| x3 | .778 | .317 | .100 |
| x4 | .073 | .012 | -.059 |
| (常量) | -79.212 | -46.721 | -49.598 |
| Fisher 的线性判别式函数 | |||
类别2:y=-46.721+0.130*x1+0.595*x2+0.371*x3+0.012*x4
类别3:y=-49.598+0.130*x1+0.637*x2+0.100*x3-0.059*x4
将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类
| 根据此判别函数对样本进行回判,结果如表8。由表8个案观察结果表可知,病人序号4实际是第一组“胃癌患者”,被判为第3组“非胃炎患者”;病人序号8实际是第二组“萎缩性胃炎患者”,被判为第3组“非胃炎患者”;病人序号11实际是第三组“非胃炎患者”,被判为第二组“萎缩性胃炎患者” |
| 三、指导教师评语及成绩: |
| 评语: 成绩: 指导教师签名: 批阅日期: |
