
一、课程的基本信息
课程编号:02210216 课程性质:专业课/必修课
学 时:48 学 分:2.5
开课单位:信息管理学院 适用专业:电子商务专业
先修课程:计算机文化基础、C语言程序设计、统计学、数据库
二、课程目的与任务
数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。 本课程全面而又系统地介绍了知识发现的方法和技术,反映了当前知识发现研究的最新成果。
本课程的重点在培养学生的实际分析数据及处理数据的能力。
三、课程教学基本要求
通过本课程的学习,要求学生初步掌握数据挖掘的重要概念和任务、数据挖掘中的常用算法(决策树、关联规则、聚类算法、贝叶斯分类算法、支持向量机、神经网络),以及数据挖掘当前的研究动向
四、教学内容及学时分配
| 教学内容 | 各教学环节学时分配 | |||||||||||
| 讲授 | 实验 | 上机 | 习题 | 讨论 | 小计 | |||||||
| 绪论 | 2 | 2 | ||||||||||
| 数据预处理 | 4 | 2 | 6 | |||||||||
| 关联规则挖掘 | 4 | 2 | 6 | |||||||||
| 决策树分类算法 | 4 | 4 | 8 | |||||||||
| 贝叶斯分类算法 | 4 | 4 | 8 | |||||||||
| 人工神经网络算法 | 4 | 4 | ||||||||||
| 支持向量机 | 4 | 2 | 6 | |||||||||
| K-means聚类算法 | 2 | 2 | 4 | |||||||||
| K-中心点聚类算法 | 2 | 2 | ||||||||||
| 神经网络聚类算法:SOM | 2 | 2 | ||||||||||
| 合 计 | 32 | 16 | 48 | |||||||||
第1章 绪论(2课时)
教学内容:
(1)数据挖掘的概念
(2)数据挖掘的历史及发展
(3)数据挖掘的研究内容及功能
(4)数据挖掘的常用技术及工具
重点:数据挖掘的研究内容及功能
难点:数据挖掘的常用技术及工具
第2章 数据预处理(4课时)
教学内容:
(1)数据预处理的目地
(2)数据清理
(3)数据集成和数据变换
(4)数据归约
(5)特征选择与提取
重点:数据集成和数据变换
难点:特征选择与提取
第3章 关联规则挖掘(4课时)
教学内容:
(1)基本概念
(2)关联规则挖掘算法---Apriori算法原理
(3)Apriori算法实例分析
(4)Apriori算法源程序分析
(5)Apriori算法的特点及应用
重点:关联规则挖掘算法---Apriori算法原理
难点:关联规则挖掘算法---Apriori算法原理
第4章决策树分类算法(4课时)
教学内容:
(1)基本概念
(2)决策树分类算法---ID3算法原理
(3)ID3算法实例分析
(4)ID3算法源程序分析
(5)ID3算法的特点及应用
(6)决策树分类算法---C4.5算法原理
重点:决策树分类算法---ID3算法原理
难点:决策树分类算法---ID3算法原理
第5章 贝叶斯分类算法(4课时)
教学内容:
(1)基本概念
(2)贝叶斯分类算法原理
(3)贝叶斯分类算法实例分析
(4)贝叶斯分类算法源程序分析
(5)贝叶斯分类算法特点及应用
重点:贝叶斯分类算法原理
难点:贝叶斯分类算法原理
第6章 人工神经网络算法(4课时)
教学内容:
(1)基本概念
(2)BP算法原理
(3)BP算法实例分析
(4)BP算法源程序分析
(5)BP算法的特点及应用
重点:BP算法原理
难点:BP算法原理
第7章 支持向量机(4课时)
教学内容:
(1)基本概念
(2)支持向量机原理
(3)支持向量机实例分析
(4)支持向量机的特点及应用
重点:支持向量机原理
难点:支持向量机原理
第8章 K-means聚类算法(2课时)
教学内容:
(1)基本概念
(2)K-means聚类算法原理
(3)K-means聚类算法实例分析
(4)K-means聚类算法源程序分析
(5)K-means聚类算法的特点及应用
重点:K-means聚类算法原理
难点:K-means聚类算法原理
第9章 K-中心点聚类算法(2课时)
教学内容:
(1)基本概念
(2)K-中心点聚类算法原理
(3)K-中心点聚类算法实例分析
(4)K-中心点聚类算法源程序分析
(5)K-中心点聚类算法的特点及应用
重点:K-中心点聚类算法原理
难点:K-中心点聚类算法原理
第10章 神经网络聚类算法:SOM(2课时)
教学内容:
(1)基本概念
(2)竞争学习算法基础
(3)SOM算法原理
(4)SOM算法原理实例分析
(5)SOM算法原理源程序分析
(6)SOM算法原理的特点及应用
重点:SOM算法原理
难点:SOM算法原理
六、考核方式与成绩评定
考核方式:考试
成绩评定:本课程成绩构成比例为:期末考核成绩占总成绩的 70 %,平时成绩占总成绩的30 %;平时成绩的各部分占总成绩比例分别为:考勤占5%,课堂测验成绩占5%,实验占15%,作业占5%
期末总评成绩=平时成绩×30%+考核成绩×70%。
补考方法: 总评成绩低于60分的学生,须参加学院统一组织的补考。
补考成绩:卷面成绩60分以上(含60分)按60分计,卷面成绩60分以下按卷面成绩计。
七、教材与主要参考书目
教 材:
《数据挖掘算法原理与实现》,王振武,清华大学出版社,2017年1月
参考书:
《数据挖掘导论》,Pang-Ning Tan,Michael Steinbach,Vipin Kumar著,范明,范宏建等译 人民邮电出版社,2011年1月。
八、大纲编写必要的说明
执笔人签字:
教研室主任签字:
分管教学领导签字:
制订日期: 年 月 日
