网站首页  词典首页

请输入您要查询的论文:

 

标题 我国P2P行业逾期行为的影响因素
范文

    王琴英+由林青

    

    

    

    【摘要】本文對可能影响逾期行为的因素采用随机森林的方法进行粗选,发现借款人所在的地区、借款用途、性别、有无子女、学历等因素的特征得分较高,通过建立逻辑回归,对粗选的结果采用逐步回归的方法,结果表明:婚姻状况、区域因素、贷款年限、学历、工作单位对逾期行为产生有较强的影响。

    一、引言

    2014年以来,我国p2p行业迅速发展,成为全世界P2P发展最快的国家,但与此同时,跑路的平台也急剧增加,类似e租宝等平台占到30%以上,针对该行业的整体态势,国家监管部门出台《私募股权众筹融资管理办法(试行)(征求意见稿)》,加强了对P2P等行业的监管,本文主要从信用风险得角度,以国内某一大型P 2P公司为研究对象,探究客户逾期行为的影响因素。

    国内对于P2P行业逾期行为的研究有很多,谈超等将影响逾期的因素划分为标的特征、信用特征、个人特征和往期借款4个维度,从中选取15个变量,通过建立logit回归方程,探究逾期行为与这些变量的关系:王重润以“红岭创投”的真实业务数据为基础,选取借款者违约行为的9个特征因素建立Logit模型进行分析,探究影响逾期的因素。

    二、还款逾期特征变量的选择

    1.数据说明

    因变量是客户类型,其中l代表新增逾期客户;0代表非逾期客户。

    本文选取我国某一较大规模的P2P公司,获取该公司2015年1月为M0,2016年1月为M1,2016年2月为M2,共931条新增逾期客户在2016年1月的数据,以及2015年12月,2016年1月,2016年2月为M0,共931条正常客户在2016年1月的931条数据,共1862条数据进行分析。其中M0:客户逾期0-30天:M1:客户逾期30-60天;M2:客户逾期60-90天;在实际业务中,习惯定义M2为新增逾期。

    选取的自变量包括:合同版本、贷款品种、片区、性别、是否续贷、综合费率、判断贷款信息是否提交过、判断个人信息是否添加过、判断工作信息是否添加过、判断联系人信息是否添加、贷款用途、学历、婚姻状态等信息。

    2.变量筛选

    本文对可能影响客户分类的35个因素采用随机森林的方法对关键变量进行提取,同时,为了避免分布不均匀的问题,采用五重交叉验证,具体过程如下:

    (1)将样本分为训练集和测试集,其中测试集占30%。

    (2)将训练集样本随机均匀分成5份样本,取其中4份样本记为N1,另一份样本记为n。

    (3)将N1采用随机森林的方法,提取特征集S1,并去掉特征分x小于0.01的特征变量。

    三、模型的建立及应用

    1.Logit回归方程

    本文对筛选出的变量采用逐步回归的方法建立Logit方程。具体过程如下:

    3.模型检验

    3.3.1模型泛化误差

    运用建立的模型,对30%的测试集进行测试,结果如下:

    四、结论及建议

    1.结论

    综上所述,影响新增逾期的因素包括:

    (1)婚姻状况。一般而言离异,丧偶,再婚的客户逾期率要高一点。

    (2)学历。学历越低,逾期率越高;一般而言学历在大专,高中,高中以下的逾期率相对来说要高。

    (3)区域因素。华东地区整体信用状况和华北相比较差,导致华东地区逾期率较高,华北片区逾期率较低。

    (4)贷款年限。一般而言期限越长的逾期率较高,风险越高。

    (5)工作单位。从单位性质来看,机关单位、国企性质的单位逾期率较低。

    2.建议

    (1)避免期限较长的产品。平台在产品设计时,尽量避免贷款期限超过一年的产品,对于超过一年的产品,加强风控部门对客户的事中管理。

    (2)尽快完善P 2 P行业的信息共享机制。目前,由于P 2 P公司对客户的信息不共享,因此,部分客户存在倒账行为,行业整体的系统性风险偏高,因此,尽快实现行业内部的信息共享机制,有利于降低这类风险,降低逾期率。

    因此,预测的准确度86.95%,模型的泛化误差较小。

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2024/12/23 5:32:20