基于数据分析的保险业营销和服务方向研究
赵玲君
摘要我国保险业正处于快速增长期,而信息时代的到来,允许车险企业可以通过数字化技术更加精准地定制营销和服务方案。本文基于车险公司数据库进行数据挖掘,将Logistic多元回归模型应用在事故率的预测中,获取对事故率影响最大的三个变量,并且提出基于聚类分析和决策树算法的续保率预测模型以进行优化,最终达到提高续保率的效果。
关键词 Logistic多元回归模型;聚类分析;Cart决策树
一、背景与研究意义
我国保险业正处于快速增长期。一方面,由于收入水平的提升,居民对健康和安全有了更高要求,进而对保险的需求有所提升;另一方面,互联网金融、大数据、云计算等科技的发展,为保险业的发展带来巨大机遇。在高速发展的保险市场中,车险作为我国渗透率最高的险种,其发展面临着巨大的机遇和挑战。
近年来,一大批保险公司互联网公司开始利用技术支持或合作等方式,介入UBl车险行列。UBl车险区别于传统车险按车型和历史出险记录定价的定价方式,旨在通过采集车主驾车的相关使用数据,来掌握车主驾驶行为,从而根据风险进行相应的车险定价[1]。
目前很多保险公司开始大力推进电销和网销,这样可以直接获取一手信息。通过直接从客户获取驾驶习惯信息,能更加精准地了解客户,制定营销和服务方案。
二、Logistic多元回归模型
Logistic回归是分类资料回归分析的一种,而且是最基础的一种。Logistic回归中,变量既可以是连续的,也可以是分类的。Logistic回归的实质是:发生概率除以没有发生概率再取对数,从而改变取值区间的矛盾和因变量自变量间的曲线关系。
我们采用多元的logistic回归模型[2]:
之后将变量及维度代入模型进行回归求解,即可求出对是否出事故影响因素最大的因素。经过简单分析得到:连续驾驶时间对于事故率的影响最为显著。本文认为连续驾车时间影响事故率主要有以下原因:一是长时间目视前方使眼睛疲劳;二是压抑感;三是长时间驾驶导致注意力不集中,不能够做出即时反应,甚至于当危险突然出现的时候,会产生头脑瞬间崩溃的现象[3]。
驾驶速度和急加速急减速发生频率也是影响事故率的重要因素。驾驶员驾驶速度越大,越容易出事故,主要原因有:一是车速越快,车辆会变得越加难以操控;二是刹车距离随车速提升而增加,增大事故发生的可能性[嗍。急加速急减速发生频率增大,出事故的概率上升。是因为急加速急减速发生频率高的驾驶员,驾驶习惯较差,更易出现急躁情绪,出事故的概率大大提升[5]。
三、基于聚类分析和决策树算法的续保率预测模型
决策树学习是以实例为基础的监督归纳学习算法,最著名的决策树算法有ID3、C415、CART等[6]。因为输入数据集不确定,因此采用CART算法m。
系统聚类算法能够对续保概率进行聚类,将此结果作为CART决策树算法的输出。将问卷数据作为决策树的输入。运用CART算法形成影响因素与续保概率之间的分类规则,最后运用规则对续保概率进行预测。
先寻找与续保概率相关的影响因素,将这些因素作为决策树的输入,运用决策树算法形成影响因素与续保概率之间的分类规则,之后运用已有规则对客户的续保概率进行预测。
通过聚类分析,将续保概率划分为“可能性较大,待定,不可能”三个层级,然后建立多方面影响因素的属性集合,Cart决策树将属性集合与从聚类中得到的三个层级联系起来,从而得到属性集合与续保概率区间的关联规则,运用所有收集到的数据进行训练和测试,得到最终从叶子结点到根节点权重逐渐增加的决策树。
通过对最终决策树的分析,可以得出影响客户续保概率高低的因素的权重。从一级影响因素到五级影响因素权重依次降低,保险公司可以针对权重较高的影响因素推出相应的方案。
参考文献:
[1]蒋炜.车险定价可否与驾驶习惯挂钩[N].解放日报,2017-12-12(13)
[2]韩中庚.数学建模方法及其应用[M]2版.北京:高等教育出版社.2008
[3]刘秀,王长君,何庆.疲劳驾驶交通事故的特点分析与预防[J]中国安全生产科学技术,2008,4 (1):128-131.Ll UXiu,WANGChang-jun. HE Qing. Characteristic analy-sis and prevention of trafficaccidents by fatigue drivingU] Journal of Safty Science and Technology.2008.4(1):128-131. (in Chinese)
[4]驾驶行为理论模型研究概述[J]张凤,李永娟,蒋丽.中国安全科学学报2010(02)
[5]愤怒情绪下的汽车驾驶行为特征及其对交通安全的影响研究[D].雷虎武汉理工大学2011
[6]基于多元回归模型的个私从业人数影响因素的实证分析[J]王亚荣江汉大学学报(自然科学版)2017(01)
[7]中国上市公司战略与企业社会责任相關性研究[J]徐娟北京城市学院学报2017(02)