最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

电信客户流失预警模型的构建

来源:动视网 责编:小OO 时间:2025-09-30 21:06:40
文档

电信客户流失预警模型的构建

基金项目:山东科技大学科学研究《春蕾计划》项目电信客户流失预警模型的构建徐燕妮刘欣颖范方山东科技大学泰安校区信息工程系,山东泰安271019引言随着电信企业之间的竞争加剧,电信运营商不断推出新的套餐和新的业务,希望能够争取到更多的市场份额。但同时也在很大程度上加大了客户的不稳定性,使得客户离网现象频繁发生。Gartner公司调查数据表明,开发一个新客户的费用是维持一个老客户的4~5倍,[1]目前美国电信行业客户流失率为30%,欧洲约为35%~50%,这从客观上推动了客户流失预测系统的研究与应用
推荐度:
导读基金项目:山东科技大学科学研究《春蕾计划》项目电信客户流失预警模型的构建徐燕妮刘欣颖范方山东科技大学泰安校区信息工程系,山东泰安271019引言随着电信企业之间的竞争加剧,电信运营商不断推出新的套餐和新的业务,希望能够争取到更多的市场份额。但同时也在很大程度上加大了客户的不稳定性,使得客户离网现象频繁发生。Gartner公司调查数据表明,开发一个新客户的费用是维持一个老客户的4~5倍,[1]目前美国电信行业客户流失率为30%,欧洲约为35%~50%,这从客观上推动了客户流失预测系统的研究与应用


基金项目:山东科技大学科学研究《春蕾计划》项目

电信客户流失预警模型的构建

徐燕妮 刘欣颖 范方

山东科技大学泰安校区信息工程系,山东 泰安 271019

引言

随着电信企业之间的竞争加剧,电信运营商不断推出新的套餐和新的业务,希望能够争取到更多的市场份额。但同时也在很大程度上加大了客户的不稳定性,使得客户离网现象频繁发生。Gartner 公司调查数据表明,开发一个新客户的费用是维持一个老客户的4~5倍,[1]目前美国电信行业客户流失率为30%,欧洲约为35% ~50%,这从客观上推动了客户流失预测系统的研究与应用。而电信企业从来不缺少客户的相关信息,比如年龄、套餐类型以及话费消费额等大量的数据,如何正确分析利用这些数据建立合理的客户流失预警模型,提高客户的忠诚度,防止客户流失,就成为每个电信运营商所亟待解决的问题。

1.客户流失预警模型的构建

1.1系统构架

客户流失预警模型的建模过程主要包括如下几个步骤,如图1所示。

(1)数据清洗:首先,从业务系统中抽取离网客户数据作为训练数据集合;对训练数据集合中的数据进行属性约简,并将约简后的属性集合作为 型的训练输入数据集合;

(2)通过关联规则,决策树等算法建立客户流失预测模型,得到客户流失原因。

(3)根据客户流失原因,制定客户挽留策略。

1.2相关定义

1.2.1客户流失的定义与原因分类流失客户一般定义为具有离网倾向,且在未来很短的一段时间(如一周或一个月)内极可能真正离网的在网客户。客户流失的原因有多种多样,但归纳起来主要有如下几类:(1)自然流失:是指客户因为企业不能给提供所期望的产品和服务(如不能提供宽带上网功能等)或者某些客观因素(如到异地工作或下岗等)而选择离网所导致的客户流失。(2)恶意流失:是指客户因为个人私欲因素(如恶意欠费后为了逃避缴费等)而选择离网所导致的客户流失。(3)竞争流失:是指客户因为企业竞争对手因素(如竞争对手提供了更优惠的资费)而选择离网所导致的客户流失。(4)失望流失:是指客户因为企业服务质量因素(如网络覆盖或服务态度等)而选择离网所导致的客户流失。

1.2.2客户属性的选定

影响客户流失预警判定的数据属性通常多种多样,这些属性之间存在着或强或弱的相关关系,通过关联度分析之后,本

文选取了1 0个与客户流失有密切关系的字段作为预测模型的输入字段。如表1所示给出了其中最重要的5种属性.

1.3客户流失预警模型的构建1.3.1决策树算法分析

国际上最有影响的决策树方法是Quinlan 提出的ID3算法,其基本思想是将一棵决策树看作一个信源,利用信息增益寻找数据仓库中具有最大信息量的字段(属性),建立决策树的一个节点,再依次将字段的不同取值作为信宿的表现状态,找出信息量最大的字段建立树的分支;然后在每个分支子集中重复建立下层节点和分支的过程,即可建立决策树。但I D 3算法偏向于选取属性较多的属性,而不一定是最优的属性,此外I D3算法学习简单的逻辑表达能力较差,针对这些不足,本文提出一种加权熵的思想,对传统的I D 3算法进行改进。

1.3.2 ID3算法的改进

设E=A1×A2×…×An 是n 维有穷向量空间,其中A1是有穷离散符号集,E 中的元素e={V1,V2,…,Vn }称为例子,其中Vi ∈Ai ,i=1,2,…,n 。

加权熵的定义:设X 为选择属性值,X 有V 个属性值,对应的权数为W1,W2,…,Wv ,按照ID3算法对属性X 进行扩展,对应的信息熵为E(B1),E(B2),…,E(Bv),定义加权熵为:E(X)*=∑Wi *E(Bi)

式中(B1,B2,…,Bv)是v 个结点选择的属性,Wi 是指分枝子集所占的权数。本文用分枝子集Bi 在整个集合中所占的比重来计算权数Wi ,然后计算出加权熵,通过比较加全熵的大小来选择属性的取值,改进的I D 3算法基本步骤如下:

(1)对属性X ,假设X 有V 个属性值,对应的权数为W1,W 2,…,W v ,以属性X 为扩展,生成V 个子结点(B1,B2,…,Bv),求对应的信息

熵E(B1),E(B2),…,E(Bv);(2)计算加权熵E(X)*;

(3)选择属性X 使得选择E(X *)*,将X 作为新选择的属性;

(4)利用步骤1)的计算结果,建立结点X *

的后继结点(B1,B2,…,Bv);

(5)对所有的Bi ,若Bi 为叶子结点,则停止扩展此结点,否则递归执行步骤1至步骤5,直至完成决策树的建立为止。

图1

表1  客户流失重要属性

表2 2011年9月到11月的流失预警客户数目统计

DOI:10.3969/j.issn.1001-8972.2012.01.027

的浓缩,水温的升高和日光照射,给细菌和藻类创造了迅速繁殖的条件。大量细菌分泌出的粘液和藻类产生的粘性物质就象粘合剂一样,能使水中飘浮的灰尘杂质和化学沉淀物等粘附在一起,形成粘糊状的沉淀物粘附在换热器的传热表面上,这种沉积物称为生物粘泥,俗称“软垢”。附着在换热器管壁上的生物粘泥,不仅会降低换热器和冷却塔的冷却作用,恶化水质,而且会引起冷却水系统中设备的腐蚀和降低水质稳定剂的缓蚀、阻垢和杀生作用。例如北京某厂换热器中菌藻大量繁殖,半个月内就使热负荷下降到50%,不得不临时停产清洗,造成重大的经济损失。

综上所述,一个效果优异的水处理方案应综合考虑以上各种因素才能保障冷却循环水系统洁净运行,达到提高设备工作效率,延长设备使用寿命的目的。

2.循环水处理效果评价

经上述水质处理,冷却循环水应满足《工业循环冷却水处理设计规范》(G B /T50050—2007)中规定:

2.1敞开式循环冷却水系统中换热设备水侧管壁的年污垢热阻值小于

3.44×10-4m 2・k /w 。

2.2 敞开式循环冷却水系统中换热设备和碳钢管壁的腐蚀速度小于0.075m m /a ,铜、铜合金和碳钢管壁的腐蚀速度小于0.005mm/a 。

2.3 敞开式循环冷却水中的异养菌数小于5×105个/mL ,粘泥量小于3ml 。

3.空调系统水处理技术方案

3.1 缓蚀阻垢剂投加量:根据厂方提供的补水水质及GR —946缓蚀阻垢试验结果,确定G R —946缓蚀阻垢剂加量为56.2kg /天,药剂浓度为50p pm 。

3.2 缓蚀阻垢剂初始投加:根据系统保有水量按230.4m 3循环水量2400m 3/h 给水温度35℃回水温度25℃设备材质为:碳钢.不锈钢.铜材。计算缓蚀阻垢剂初投加药量为GR —946缓蚀阻垢剂67.7kg 。将该药剂一次性缓慢加入循环水系统内。

3.3 日常水处理:根据系统日补水量加药量按56.2k g /天。

3.4 杀菌灭藻使用方法:根据系统菌藻繁殖情况及循环水细菌个数确定G R -937杀菌灭藻剂(非氧化性)及GR-938杀菌灭藻剂(氧化性)加入时机,两种药剂交替使用,以减少细菌的抗药性,一般情况下,夏季每3~5天加一次;春秋季每5~10天投加一次;冬季每10~15天投加一次,连续投加两次,每次加药量为23k g 。

3.5 根据厂方的水质条件,加装自动排污管道,维持系统浓缩倍率

4.5倍以下。

3.6 定期取循环水样分析,其分析结果应满足以下水质标准如表1所示。

表1中指标的控制必须通过排污,补充水量及控制投加药剂来实现。

4.空调系统日常保养、维护

4.1水处理工作按照第六节水处理基本工艺执行;严格控制执行水处理加药工作,建议制定日常水处理操作记录,由专人负责日常水处理加药工作,并做好详细记录;

4.2冷却循环水应坚持排污,以控制浓缩倍数,达到将系统内沉积的粘泥排出的目的;

4.3冷却系统循环水泵前端排污口定期排污操作同上;

4.4机组冷凝器定期排污,排污时进

1.3.3增加剪枝处理:

在实际应用中,基本的决策树构造算法没有考虑噪声,生成的决策树完全拟合于训练集,因此在实际的算法中有必要考虑对噪声的处理,剪枝正是针对噪声现象提出来的技术。剪枝就是删去决策树中底层的分支或整个子树,以提高分类识别的速度和能力。常用的剪枝方法一般有“事前剪枝”(Prepruning 即通过在当前节点上就判断是否需要继续划分该节点所含训练样本集来实现)和“事后剪枝”(Postpruning 从一个“充分生长”树中,修剪掉多余的树枝)。本文所用的改进算法中使用的就是一种事后剪枝的方法,通过计算内部节点的错误概率对决策树的影响,自下而上检查内部节点,如果子树产生的错误大于用叶节点来替代它所产生的错误,就剪掉子树,这样就可以修剪出一棵更小的和错误率更低的决策树,从而提高决策树分类的速度和分类性能。

2.客户流失预警模型的评估

模型评估是运用Clementine 的分析节点对已建立的客户流失预测模型进行精确性分析,基于上述客户流失预警模型,从2011年9月起,山东某主流电信运营商在其一个地市分公司客服部使用该客户流失预警模型进行了流失预警客户测试,客户流失分析模块在每月月初提供的当月的流失预警客户名单,表2是客户流失分析模块提供的2011年9月到11月的流失预警客户数目统计:

利用该预警模型,该分公司客服部门9、10、11月份成功回访的客户分别为5901户、5800户、5845户,成功回访率分别为92.14%、91.74%、94.12%,其中,在1、2、3月份成功回访的客户中分别有超过80%以上的客户均表达了近期有离网的意图,但由于客服部门提前采取了一系列有针对性的客户维挽措施,这些客户最终打消了离网念头,保证了电信公司的利润。

3.结语

决策树是一种重要的分类预测模型,本文主要以某地市电信企业的客户为目标用户群,反复提炼该预警模型。应用结果表明,该模型可提供较准确的决策依据,市场部门能对流失倾向较高的客户群体采取针对性的挽留措施。但由于电信的业务变化性强,方案仍需要不断改进,接下来的工作是将整个方案整合到该企业的经营分析系统中去,使其发挥更大的价值。

参考文献

[1]方红.读者流失预警模型及其在公共图书情报机构中的应用[J].黑龙江科技信息, 2007,(4):103

[2]罗布・马蒂森.电信业客户流失管理—电信管理精选译丛[M].北京:人民邮电出版社, 2006: 4~26

[3]李阳.数据挖掘在电信行业客户流失管理中的研究与应用.电脑知识与技术,2010,6(3): 518~512

[4]刘志超.基于数据挖掘技术的客户流失预警模型.软件时空 2011,27(2):175-177。

文档

电信客户流失预警模型的构建

基金项目:山东科技大学科学研究《春蕾计划》项目电信客户流失预警模型的构建徐燕妮刘欣颖范方山东科技大学泰安校区信息工程系,山东泰安271019引言随着电信企业之间的竞争加剧,电信运营商不断推出新的套餐和新的业务,希望能够争取到更多的市场份额。但同时也在很大程度上加大了客户的不稳定性,使得客户离网现象频繁发生。Gartner公司调查数据表明,开发一个新客户的费用是维持一个老客户的4~5倍,[1]目前美国电信行业客户流失率为30%,欧洲约为35%~50%,这从客观上推动了客户流失预测系统的研究与应用
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top