标题 | 我国P2P行业逾期行为的影响因素 |
范文 | 王琴英+由林青 【摘要】本文對可能影响逾期行为的因素采用随机森林的方法进行粗选,发现借款人所在的地区、借款用途、性别、有无子女、学历等因素的特征得分较高,通过建立逻辑回归,对粗选的结果采用逐步回归的方法,结果表明:婚姻状况、区域因素、贷款年限、学历、工作单位对逾期行为产生有较强的影响。 一、引言 2014年以来,我国p2p行业迅速发展,成为全世界P2P发展最快的国家,但与此同时,跑路的平台也急剧增加,类似e租宝等平台占到30%以上,针对该行业的整体态势,国家监管部门出台《私募股权众筹融资管理办法(试行)(征求意见稿)》,加强了对P2P等行业的监管,本文主要从信用风险得角度,以国内某一大型P 2P公司为研究对象,探究客户逾期行为的影响因素。 国内对于P2P行业逾期行为的研究有很多,谈超等将影响逾期的因素划分为标的特征、信用特征、个人特征和往期借款4个维度,从中选取15个变量,通过建立logit回归方程,探究逾期行为与这些变量的关系:王重润以“红岭创投”的真实业务数据为基础,选取借款者违约行为的9个特征因素建立Logit模型进行分析,探究影响逾期的因素。 二、还款逾期特征变量的选择 1.数据说明 因变量是客户类型,其中l代表新增逾期客户;0代表非逾期客户。 本文选取我国某一较大规模的P2P公司,获取该公司2015年1月为M0,2016年1月为M1,2016年2月为M2,共931条新增逾期客户在2016年1月的数据,以及2015年12月,2016年1月,2016年2月为M0,共931条正常客户在2016年1月的931条数据,共1862条数据进行分析。其中M0:客户逾期0-30天:M1:客户逾期30-60天;M2:客户逾期60-90天;在实际业务中,习惯定义M2为新增逾期。 选取的自变量包括:合同版本、贷款品种、片区、性别、是否续贷、综合费率、判断贷款信息是否提交过、判断个人信息是否添加过、判断工作信息是否添加过、判断联系人信息是否添加、贷款用途、学历、婚姻状态等信息。 2.变量筛选 本文对可能影响客户分类的35个因素采用随机森林的方法对关键变量进行提取,同时,为了避免分布不均匀的问题,采用五重交叉验证,具体过程如下: (1)将样本分为训练集和测试集,其中测试集占30%。 (2)将训练集样本随机均匀分成5份样本,取其中4份样本记为N1,另一份样本记为n。 (3)将N1采用随机森林的方法,提取特征集S1,并去掉特征分x小于0.01的特征变量。 三、模型的建立及应用 1.Logit回归方程 本文对筛选出的变量采用逐步回归的方法建立Logit方程。具体过程如下: 3.模型检验 3.3.1模型泛化误差 运用建立的模型,对30%的测试集进行测试,结果如下: 四、结论及建议 1.结论 综上所述,影响新增逾期的因素包括: (1)婚姻状况。一般而言离异,丧偶,再婚的客户逾期率要高一点。 (2)学历。学历越低,逾期率越高;一般而言学历在大专,高中,高中以下的逾期率相对来说要高。 (3)区域因素。华东地区整体信用状况和华北相比较差,导致华东地区逾期率较高,华北片区逾期率较低。 (4)贷款年限。一般而言期限越长的逾期率较高,风险越高。 (5)工作单位。从单位性质来看,机关单位、国企性质的单位逾期率较低。 2.建议 (1)避免期限较长的产品。平台在产品设计时,尽量避免贷款期限超过一年的产品,对于超过一年的产品,加强风控部门对客户的事中管理。 (2)尽快完善P 2 P行业的信息共享机制。目前,由于P 2 P公司对客户的信息不共享,因此,部分客户存在倒账行为,行业整体的系统性风险偏高,因此,尽快实现行业内部的信息共享机制,有利于降低这类风险,降低逾期率。 因此,预测的准确度86.95%,模型的泛化误差较小。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。