
8.7
1 将count也看作为一个属性,广义的元组有11个变为165个。利用增益率来判断属性的顺序。计算后得,应该按照department 来划分。
2按照department 划分后再按照age 划分,每组里面年龄最大的就是senior,再按salary 划分,工资高的就是senior.
3设元组的各属性之间不,其联合概率不能写成份量相乘的形式。 所以已知:X=(department=system,age=26…30,salary=46K…50K),元组总数 为:30+40+40+20+5+3+3+10+4+4+6=165。
先验概率:
当 status=senior 时,元组总数为:30+5+3+10+4=52,P(senior)=52/165=0.32 ;
当 status=junior 时 , 元 组 总 数 为 : 40+40+20+3+4+6=113 ,
P(junior)=113/165=0.68 ;
因为 status=senior 状态没有对应的 age=2 6…30 区间,所以:P(X|senior)=0;
因为 status=junior 状态对应的 partment=systems 、age=26…30 区间的总元组 数为:3,所以:P(X|junior)=3/113; 因为:P(X|junior)P(junior)=3/113×113/165=0.018>0=P(X|senior)P(senior); 所以:朴素贝叶斯分类器将 X 分到 junior 类。
8.12
| 元组编号 | 类 | 概率 | TP | FP | TN | FN | TPR | FPR |
| 1 | P | 0.95 | 1 | 0 | 5 | 4 | 0.2 | 0 |
| 2 | N | 0.85 | 1 | 1 | 4 | 4 | 0.2 | 0.2 |
| 3 | P | 0.78 | 2 | 1 | 4 | 3 | 0.4 | 02 |
| 4 | P | 0.66 | 3 | 1 | 4 | 2 | 0.6 | 0.2 |
| 5 | N | 0.60 | 3 | 2 | 3 | 2 | 0.6 | 0.4 |
| 6 | P | 0.55 | 4 | 2 | 3 | 1 | 0.8 | 0.4 |
| 7 | N | 0.53 | 4 | 3 | 2 | 1 | 0.8 | 0.6 |
| 8 | N | 0.52 | 4 | 4 | 1 | 1 | 0.8 | 0.8 |
| 9 | N | 0.51 | 4 | 5 | 0 | 1 | 0.8 | 1 |
| 10 | P | 0.40 | 5 | 5 | 0 | 0 | 1 | 1 |
8.14
a=[30.5 32.2 20.7 20.6 31 41 27.7 28 21.5 28 ];
b=[22.4 14.5 22.4 19.6 20.7 20.4 22.1 19.4 18.2 35];
a1=mean(a);
b1=mean(b);
sum=0;
d=a1-b1;
for i=1:10
sum=sum+(a(i)-b(i)-d).^2;
end
t=10*d/sqrt(sum)
t =2.63
查表后得2.7,所以两者之间差异是偶然的,没有太大区别
