内容摘要………………………………………………………………………………………….1
一、保数据挖掘的概念及其方法……………………………………………...………………..2
(一)数据挖掘的概念……………………………………………………………….2
(二)数据挖掘的主要方法………………………….……………………………………2
1.概念/类描述、特征化和区分…………………………………………………………2
2.关联分析…………………………………………………………………………………2
3.聚类分析…………………………………………………………………………………2
4.孤立点分析………………………………………………………………………………2
5.演变分析…………………………………………………………………………………2
二、数据挖掘技术在网络营销中的应用……………………………………………………..2
(一)客户特征分析……………………………………………………………………….3
(二)利用分类法可以有效识别优质客户 …………………………………………….3
(三)利用关联分析进行促销 ………………………………………………………….3
(四)序列模型在网站管理中的应用 ………………………………………………….4
(五)利用聚类分析可以提高服务成功率 …………………………………………….4
(六)在信用风险管理中的应用 ……………………………………………………….4
(七)Web挖掘 ………………………………………………………………………….4
.
三、结 论…………………………………………………………………….……………..5
参考文献…………………………………………………………………………..…...…………5
网络营销中数据挖掘技术的应用研究
---互联网技术在市场营销中应用
王某某 工商管理市场营销 011010172
内容摘要
本文介绍了数据挖掘技术在网络营销中的应用,通过利用数据挖掘过程中的一些主要方法,对网站中客户访问的日志文件、web服务器上的数据库等数据进行分析,找出规律,以便了解客户的兴趣爱好,有利于更好地调整站点的结构,使商家获知所需市场信息,开发客户资源潜力。
关键词:网络营销 数据挖掘 关联模型
网络营销中数据挖掘技术的应用研究
--互联网技术在市场营销中应用
网络营销是指以Internet网络为载体,利用数字化电子方式开展的销售活动。随着Internet技术和Web技术的发展,网上购物也变得越来越火。据统计,2007年度中国互联网调查统计数据显示:2007年中国C2C电子商务市场保持健康增长,交易规模为410.4亿元人民币,较2006年增长90 。网络营销比传统销售方式更加激烈,原因主要有:一是客户从一个网站转换到竞争对手那边,只需点击几下鼠标即可;二是网站的内容、层次、用词、标题、奖励方案、服务等任何一个地方都有可能成为吸引客户或失去客户的因素。同时,网站每天都可能有上百万次的在线交易,生成大量的记录文件和登记表。如何对这些数据进行分析和挖掘,以充分了解客户的喜好、购买模式,甚至是客户一时的冲动,进而设计出满足于不同客户群体需要的个性化网站,增加自己的竞争力,已变得势在行。
一、数据挖掘的概念及其方法
(一)数据挖掘的概念
数据挖掘是从大量存储的数据中,利用模式识别、统计和数学的技术,筛选发现新的有意义的关系、模式和趋势的方法。数据挖掘所要处理的问题就是在庞大的数据库中寻找出有价值的隐藏事件,加以分析并将这些有意义的信息归纳成结构模式以帮助企业进行科学化的决策。
数据挖掘是一个循环往复的过程,其挖掘过程一般分为以下五个阶段:
1.定义业务问题:从业务角度来理解数据挖掘的目标和要求,再转化为数据挖掘问题。
2.设计数据模型,建立数据仓库。
3.分析挖掘数据,建立数据集市。
4.建立模型:选取数据挖掘工具提供的算法并应用于准备好的数据,选取相应参数,生成模型。
5.评估、解释和应用模型:对模型进行比较和评估、生成一个相对最优模型并对此模型用业务语言加以解释且应用到业务活动中。
(二)数据挖掘的主要方法
1.概念/类描述、特征化和区分:对每个类的汇总、简洁、精确的描述可以通过数据特征化、数据区分和数据比较来实现。数据特征化是指目标类数据的一般特征或特征的汇总,如一年的成绩汇总;数据区分是将目标类对象的一般特征与一个或多个对比类对象的一般性比较,如A学校和B学校的比较。
2.关联分析:目的在于发现关联规则,这些规则揭示属性与属性值在数据集中一起出现的条件。这种关联规则可以是单维关联规则或关联规则。
分类与预测:利用某种数据挖掘算法的某种规则自动对海量数据进行分类,其间较少有人工干预,目的是为数据挖掘基础上的预测服务。
3.聚类分析:聚类是根据最大化类内的相似性、最小化类间的相似性原则对海量数据进行聚类或分组,从而产生属性相近的各个类。
4.孤立点分析:所谓孤立点,是指数据集合中与多数数据的特征或行为完全不一致的数据。在最初的挖掘算法中,人们总是将孤立点从数据集合中删除,以保证数据的纯洁性。然而,删除孤立点可能会导致忽略某些非常有用的特殊规则,因而对孤立点需作特殊处理。
5.演变分析:可以根据数据的特征对数据的发展变化作出相应的预测与分析。主要应用于对时间序列数据的分析、序列或周期模式匹配和基于类似性的数据分析。
二、数据挖掘技术在网络营销中的应用
(一)客户特征分析
利用数据挖掘功能分析客户特征,目的在于帮助网上销售商了解客户的消费需求。根据数据挖掘的基本原理,结合网络营销的特点,本文设计基于数据挖掘技术基础上的客户特征分析系统如图1所示:
图1 基于数据挖掘技术的客户特征分析系统
该系统共由四个模块组成:
1.人机接口界面:客户可以向系统手工添加客户基本信息、提出浏览或查询要求,同时查看查询结果。
2.数据获取模块:收集的信息包括客户的基本信息、登录信息、订单信息、浏览记录等。
3.数据处理模块:数据库按照元数据标准对数据进行清理、集成和变换。
4.数据分析模块:利用经过转化的数据,综合企业的新数据库,按照数据挖掘规则,运用数据挖掘技术,如机器学习、神经网络、概率统计、关联规则、粗糙集理论等,对数据进行分析处理,得出结果并输出。
(二) 利用分类法可以有效识别优质客户
数据分类是通过在训练集上针对某一属性进行类划分,建立描述并区分数据类或概念的模型,再使用该模型对数据类集进行划分。在网络营销中通过数据挖掘,比如,发现在/company/movies进行过在线订购的客户中有6O 是2O一3O岁生活在大中城市的年轻人。得到分类后,就可以针对这一类客户的特点展开商务活动,提供有针对性的个性化的信息服务。
目前,许多销售商经常试图在众多的客户中识别出优质客户,但却一直无法确定优质客户的标准。这里可首先假设类标号属性是“是否为优质客户”,然后采用分类法,通过在一定的客户群上进行学习,最后确定出优质客户的i'Tq~i准则。利用分类法还有利于培养和选择忠诚客户。客户忠诚是基于对网上商店的信任度、往来频率、服务效果、满意程度以及继续从网站订货的可能性的综合评估值。为了留住老顾客,防止客户流失,就必须了解顾客的需求。首先设类标号属性是“顾客是否流失”,再利用数据挖掘工具对大量的客户资料进行分析,建立数据模型,以确定客户的购买习惯、购买数量和购买频率,分析客户对某个产品的忠诚程度、持久性等,以确定忠诚客户,并为他们提供个性化定制服务。
(三) 利用分类法可以有效识别优质客户
关联分析就是给定一组或一个记录集合,通过分析记录集合,推导出项的相关性,目的是为了挖掘出隐含在数据间的相互关系。在网络营销中关联规则的发现也就是找到客户对网站上各种文件之间访问的相互联系的问题,就是得到如下形式的规则:A ^⋯^A =>B ^⋯ ^B ,其中A.(iE(1,⋯ ,m))与B,(jE(1,⋯ ,n))均为在数据库中相关数据特征属性值的集合。例如,用关联规则技术,我们可以发现如果客户在一次访问行为中,访问了页面/company/productI时,一般也会访问页面/company/product2,因为客户~ 般都会比较功能相同或相关的产品.寻找性价比最高的商品。如客户在线购买某一品牌的牛奶,一般他/她也会购买某一品种(另一品牌)的面包。再比如某客户购买某品牌的手机,他也可能购买该手机配套的电池、充电器或手机饰品。进行Web上的数据挖掘,构建关联模型,我们可以更好地组织站点,减少用户过滤信息的负担。
(四) 序列模型在网站管理中的应用
序列模式分析的侧重点在于分析数据间的前后或因果关系。就是在时间有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式。例如,在/company/productl上进行过在线定购的顾客,有6O 的人在过去20天内也在/company/product2处下过定单。发现序列模式能够便于网站的组织者预测客户的访问模式,对客户提供个性化的服务;网站的管理员可将访问者按浏览模式分类,在页面上只展示具有该浏览模式的访问者经常访问的链接,而用一个“更多内容⋯”指向其他未被展示的内容。当访问者浏览到某页面时,检查他的浏览所符合的序列模式,并在显眼的位置提示“访问该页面的人通常接着访问”的若干页面。
(五) 利用聚类分析可以提高服务成功率
与分类分析不同,聚类分析通过无指导学习,按类相似性最大化、类间相似性最小化的原则,自动对数据分类。聚类分析的输入集是一组未标定的记录,也就是说,此时输人的记录还没有进行任何分类。其目的是根据一定的规则.并采取显式或隐式的方法描述不同的类型。聚类分析是网络营销中很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,更好地帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。如通过对众多的浏览“Camera”网页的客户分析,发现在该网页上经常花一段时间浏览的客户,再通过对这部分客户的登记资料分析,知道这些客户是潜在要买相机的客户群体。就可以调整“Camera”网页的内容和风格,以适应客户的需要。
(六) 在信用风险管理中的应用
信用风险管理是网络营销中锋重要的问题之一。客户下订单后会不会付款?怎样付款?多长时间会收到款项?这一系列问题都需要详细分析,有的放矢,组织货源。对客户信用评价过高,原来一批认为会付款的结果未付款,会造成库存商品积压,影响资金周转。对客户信用评价过低,商店准备不足,会造成发货时间过长,影响商店信誉。为了保证最大的利润和最小的风险,应根据客户历史资料,分析客户的信誉度和付款的可能性。数据挖掘技术可为个人信用风险控制提供客观、准确的评估和控制机制。例如,利用有指导学习中的分类算法,银行对已收集的大量的客户账户信息进行科学的分析和归类,并进行信用评估,从而找出“优”、“良”、“差”不同等级的顾客的特征属性,建立信用等级的显示描述。又如,可根据对大量定单信息分析,了解各类客户付款的可能性、采用的付款方式、各类付款方式到帐的时间等,从而合理安排进货、库存、发货等。
(七) Web挖掘
Web挖掘是数据挖掘的一项重要应用。web挖掘是从与www相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息的过程。www 分析就是为网站运行提供深入、准确、详细的分析数据和有价值的以及易理解的分析知识。通过提供这些数据和信息,可以解决以下问题:
1.对网站的修改更加有目的、有依据,稳步地提高用户满意度。根据用户访问模式修改网页之间的链接,把用户想要的信息以更快、更有效的方式展现给用户。
2.查看网站流量模式。发现用户的需要和兴趣,对需求强烈的网页提供优化,用服务器预先存储的方法来解决下载缓慢的问题。
3.提供个性化网站。针对不同的用户,按照其个人的兴趣和爱好(数据挖掘算法得到的用户访问模式),向用户动态提供浏览的建议,自动提供个性化的网站。
4.发现系统性能瓶颈,找到安全漏洞。
5.为网上客户等提供重要的、有价值的信息。如通过对每个客户所浏览的商品进行分析,得出商品之间的关联性及其他一些有用的信息,用来向客户提供个性化服务等。
6.通过对学习者学习行为的挖掘,发现用户的访问习惯。
三、结论:
当今时代,网上购物的发展势头越来越强劲,面向网络营销的数据挖掘将是一个非常有前景的领域。通过分析和探索web日志记录中的规律可以识别网上的潜在客户,增强对最终用户的信息服务,并改进We b服务器系统的性能。面向网络营销的数据挖掘能自动预测客户的消费趋势、市场走向,指导企业建设个性化的智能网站,并能为企业带来巨大的商业利润。网络营销将为企业创建新的商业增长点。但不可否认,在面向网络营销的数据挖掘中还存在很多急需解决的问题,比如怎样将服务器的日志数据转化成适合某种数据挖掘技术的数据格式;怎样解决分布性、异构性数据源的挖掘问题;如何控制整个Web上的知识发现过程等等。
参考文献
[1]朱晓明:数据挖掘及其在商业领域中的应用EJJ,信阳农业高等专科学校学报,2005年。
[2]马宏伟:数据挖掘在网络信息中的应用EJ],情报探索,2005年。
[3]徐险峰:基于web的网络信息数据挖掘技术[J],情报探索,2005年。
[4]张娥,郑斐峰,冯耕中:Web日志数据挖掘数据预处理方法研究[J],计算机应用研究,2004年。