标题 | 一种基于决策树的移动通信客户流失分析方法 |
范文 | 杨怡涵+柳炳祥+万义成 [摘 要]本文将决策树算法应用于移动客户的流失分析中,使用SPPS-Clementine软件中的C 5.0算法,對某企业某段时间的移动通信投诉数据进行分析,目的是根据移动通信公司投诉数据进行分组,发现流失度大的客户的共同特征属性,以便对流失度大的客户做好挽留工作,改善客户关系,提升企业核心竞争力。 [关键词]决策树;投诉;流失度;移动通信;客户 doi:10.3969/j.issn.1673 - 0194.2016.22.044 [中图分类号]F224 [文献标识码]A [文章编号]1673-0194(2016)22-00-02 0 引 言 移动通信客户的流失分析一直是企业关注的热点问题,如何做到提升客户满意度,防止客户流失,加强客户分类管理,吸引潜在客户群体,提高运营商服务质量,是提升企业核心竞争力的关键所在。本文使用决策树算法,对某企业投诉数据进行分析,目的是发现流失客户的共同属性,做好客户关系管理工作。 1 决策树算法 决策树算法最早是由J.R.Quinlan提出的ID3方法,其建树算法具有思想简单、识别样本属性效率高的优点,ID3方法成为20世纪80年代末机器学习领域当中最有影响力的算法之一。在20世纪90年代的时候,J.R.Quinlan提出ID3改进版,即C 4.5方法。C 4.5方法是用信息论中互信息率来选择属性作为决策树的结点,使决策树识别样本的效率得到了不小的提升。C 5.0算法是C 4.5的升级版,多数用在商业领域数据挖掘技术当中。主要针对大数据的分类,它的决策树归纳与C 4.5很相近。 ID3算法的流程是对训练集样本的数据进行预处理,计算出训练集样本属性划分前的熵;然后计算出训练集样本属性划分后的熵,通过比较样本属性划分前后的熵,计算出前后熵的差值;取最大差值的行列进行合理划分,划分出来后数据集所有元素标签确立唯一性,有且只有一个属性;若无法确定唯一属性,则回到第一步,重新比较分析,直到建树成功,整个建树过程结束。 2 决策树算法在移动通信客户流失分析中的应用 2.1 实验数据集 本次实验过程使用的数据集有2 711个样本,有投诉内容、故障行政区、使用网络类型、责任原因、终端描述、客户品牌和客户流失度7个属性,见表1。 2.2 实验过程 选取某移动通信公司的客户投诉数据,将Excel表格导入SPPS-Clementine软件当中,首先选择“源”下方“Excel”确保数据导入软件当中;选择“字段选项”下方“类型”确定模型的类型,最后选择“建模”下方的“C 5.0”算法。数据流如图1所示。 模型对训练集选取样本50%、75%、100%的数据,对客户流失分析的准确度分别为97.88%、98.12%、98.01%,如图2所示。 2.3 结果分析与讨论 利用SPPS-Clementine软件中的C 5.0算法,对移动通信客户的流失行为进行分析,分别选取样本的50%、75%、100%数据集进行分析,准确度依次为97.88%、98.12%、98.01%。从实验结果可以看出,选取75%样本的准确度较精确,但是所有的取样精确度之间数据相差不大。从图2可以看出,决策树算法在移动通信客户流失分析中的应用是可行的和有效的,为移动通信公司进行客户流失分析提供了一种分析的思路和解决方法。 3 结 语 本文通过对某通信公司投诉数据流失度分析表明,C 5.0算法表现出更良好的适应性,对用户流失度分析更精确、更高效、更方便。 主要参考文献 [1]刘尧坤.顾客投诉管理与处置技巧[M].广州:广东经济出版社,2005. [2]徐远纯,盛昭瀚,柳炳祥.一种基于决策树算法的客户流失危机分析方法[J].计算机与现代化,2004(8). [3]赵小宁,李凤霞.因子分析法和聚类分析法在网上银行客户满意度研究中的应用[J].时代金融,2015(3). [4]蒋斌.数据挖掘技术在客户关系管理中的运用[J].云南大学学报:自然科学版,2006(z1). [5]于莉. 数据挖掘技术在移动通信业中的应用研究[D]. 天津:天津大学, 2006 . |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。