标题 | 浅谈电信行业客户重入网分析方案 |
范文 | 雷蕾 余凤丽 【摘要】 电信行业客户重入网会带来大量营销资源的无效消耗,同时带来离网率过高和用户虚增等异常现象,为此,业务分析人员通过建立模型识别出重入网客户加以管理,但是识别的准确率一直不够理想。本文总结重入网建模经验,结合大数据IT建设成果,分析各种识别方法的优劣,为模型优化提供参考。 【关键词】 重入网 模型 大数据 一、背景及研究现状分析 重入网客户行为指的是已拥有某电信运营商的A地市分公司一个移动号码的客户,由于某种原因又新买了该运营商A地市分公司的另一个同类终端产品(手机、数据卡、上网本、MIFI)的号码入网。由此消耗的营销资源包括号卡资源以及渠道销售成本,还有客户在重入网后对前一号卡进行弃卡,引发恶意欠费等现象。传统的重入网识别技术是基本信息识别、IMEI识别和社交匹配度识别,这三种技术或单独或交叉使用,但是这些识别技术准确率低,例如基于用户资料的移动用户身份识别准确率仅为42%,有待改进:1、客户基本信息在实名制还未普及的情况下,很多信息是错误的;2、IMEI识别受山寨机的影响,存在错误;3、可引入大数据实现信令数据的采集,对用户的位置信息进行定位和跟踪,从而分析两个用户是一个客户的可能性。 二、客户重入网识别方法优化方案介绍 以下介绍三种模型优化的方法。 2.1客户基本信息校验 客户基本信息主要包括姓名、家庭住址和身份证,先对客户信息的有效性进行验证,仅在信息有效的客户中识别重入网用户: 1、姓名识别,剔除: 以下一个或多个词语的用户:“预开”、“营业厅”、“开户”、“直邮”、“套卡”、“代销”、“中心”、“批量”、“批开”、“直供”; 中文字符小于2个的。 2、家庭住址识别:剔除中文字符小于2个的。 3、身份证有效性识别,为防止客户乱填,号码有效性识别如下: 参数1:取前17位数字,以i表示其所在位数,从左向右依次为17、16、15...2、1;参数2:每一位上的身份证号码数字记为Ai 参数3:计算MOD(2^i,11),记为Wi;参数4:将每一个Ai与对应位置上的Wi相乘。 将参数4得到的17个数值求和,然后除以11求余数,得到一个数值n 通过n在下面的对应表中进行查表,得到最终的校验位字符: 计算值n 0 1 2 3 4 5 6 7 8 9 10 校验码 1 0 X 9 8 7 6 5 4 3 2 2.2IMEI信息有效性校验 采用IMEI识别之前,先判定客户的唯一有效IMEI,主要分为以下两种判定方式: 1、剔除1个IMEI对应多个号码的情况,即山寨机: IMEI号对应3个以上号码; IMEI长度小于14个字符; IMEI字符全是0或者空的。 2、剔除1个号码对应多个IMEI 的情况,这类客户可能存在频繁换机情况: IMEI号对应3个及以上号码 ; 用户2个IMEI号,取一个月内使用天数最多的标识为用户的唯一有效IMEI。 三、引入用户位置轨迹匹配 同一个客户的上班地点、住宅地点相对固定,而且该客户出现在这类地点的时间遵循一定的规律,所以,通过比较两个用户在上班地点和住宅地点,来识别两个用户是一个客户的可能性。首先,按照工作日白天、工作日晚上、休息日白天、休息日晚上来划分时段;其次,A口信令数据在客户进行位置移动、开机、关机、通话时等操作会产生数据,无以上操作时,将按照一定的时间间隔进行采集,由此可以计算出客户在该基站下的逗留时长;最后,匹配客户在这四个时段的相同位置的逗留时长,即可评估两个用户是同一客户的可能性。 四、总结及下一步发展 经过对比测试,对客户基本信息和IMEI信息进行校验后,分别有30%和38%的信息正确可用,只针对信息有效的用户识别,重入网准确率达到75%;其余客户基本信息和IMEI信息错误的用户,采用交往圈和位置轨迹匹配的方案提升重入网客户识别的覆盖率,这部分用户通过外呼确认,准确率为48%。总体而言,通过三种方法的引入,能有效提升模型识别的准确率。通过加强社会渠道的管控,随着实名制的普及和携号转网业务的发展,重入网客户可在业务办理时即得到识别和控制。 参 考 文 献 [1]温瑞军.移动代理商渠道养卡套利行为识别与治理[J].电子技术与软件工程,2015(3):54-55. [2]罗亚.移动电话用户重入网识别及营销建议.北京邮件大学硕士论文,2010. [3]王征,包磊.基于网络访问项序的移动用户重入网身份识别方法[J].大连理工大学学报,2015(2):016. [4]日发帖赵丽莎.基于数据挖掘的电信客户重入网预测系统的研究.昆明理工大学硕士论文,2014. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。