最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

数据挖掘作业3

来源:动视网 责编:小OO 时间:2025-10-03 09:46:55
文档

数据挖掘作业3

智能信息处理第三次作业费洋20130109050108.71将count也看作为一个属性,广义的元组有11个变为165个。利用增益率来判断属性的顺序。计算后得,应该按照department来划分。2按照department划分后再按照age划分,每组里面年龄最大的就是senior,再按salary划分,工资高的就是senior.3设元组的各属性之间不,其联合概率不能写成份量相乘的形式。所以已知:X=(department=system,age=26…30,salary=46K…50K),元
推荐度:
导读智能信息处理第三次作业费洋20130109050108.71将count也看作为一个属性,广义的元组有11个变为165个。利用增益率来判断属性的顺序。计算后得,应该按照department来划分。2按照department划分后再按照age划分,每组里面年龄最大的就是senior,再按salary划分,工资高的就是senior.3设元组的各属性之间不,其联合概率不能写成份量相乘的形式。所以已知:X=(department=system,age=26…30,salary=46K…50K),元
智能信息处理第三次作业                 费洋 2013010905010

8.7

1 将count也看作为一个属性,广义的元组有11个变为165个。利用增益率来判断属性的顺序。计算后得,应该按照department 来划分。

2按照department 划分后再按照age 划分,每组里面年龄最大的就是senior,再按salary 划分,工资高的就是senior.

3设元组的各属性之间不,其联合概率不能写成份量相乘的形式。 所以已知:X=(department=system,age=26…30,salary=46K…50K),元组总数 为:30+40+40+20+5+3+3+10+4+4+6=165。

先验概率:

当 status=senior 时,元组总数为:30+5+3+10+4=52,P(senior)=52/165=0.32 ; 

当 status=junior   时 , 元 组 总 数 为 : 40+40+20+3+4+6=113   ,

P(junior)=113/165=0.68 ;

因为 status=senior 状态没有对应的 age=2 6…30 区间,所以:P(X|senior)=0; 

因为 status=junior 状态对应的 partment=systems 、age=26…30 区间的总元组 数为:3,所以:P(X|junior)=3/113; 因为:P(X|junior)P(junior)=3/113×113/165=0.018>0=P(X|senior)P(senior); 所以:朴素贝叶斯分类器将 X 分到 junior 类。

8.12

元组编号概率TPFPTNFNTPRFPR
1P0.9510540.20
2N0.8511440.20.2

3P0.7821430.402
4P0.6631420.60.2
5N0.6032320.60.4
6P0.5542310.80.4
7N0.5343210.80.6
8N0.5244110.80.8
9N0.5145010.81
10P0.40550011

8.14

a=[30.5 32.2 20.7 20.6 31 41 27.7 28 21.5 28 ];

b=[22.4 14.5 22.4 19.6 20.7 20.4 22.1 19.4 18.2 35];

a1=mean(a);

b1=mean(b);

sum=0;

d=a1-b1;

for i=1:10

    sum=sum+(a(i)-b(i)-d).^2;

end

t=10*d/sqrt(sum)

t =2.63

查表后得2.7,所以两者之间差异是偶然的,没有太大区别

文档

数据挖掘作业3

智能信息处理第三次作业费洋20130109050108.71将count也看作为一个属性,广义的元组有11个变为165个。利用增益率来判断属性的顺序。计算后得,应该按照department来划分。2按照department划分后再按照age划分,每组里面年龄最大的就是senior,再按salary划分,工资高的就是senior.3设元组的各属性之间不,其联合概率不能写成份量相乘的形式。所以已知:X=(department=system,age=26…30,salary=46K…50K),元
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top