标题 | 基于贝叶斯算法理论的企业信贷策略研究 |
范文 | 张娜 郝子硕 方秀男 摘 要:银行信贷业务是银行通过发放银行贷款收回本金和利息,来实现银行的盈利,而且近年来越来越多的企业开始关注银行信贷高额的利润和它潜在的巨大发展空间。银行也会根据各类型企业的发展规模及信誉记录,评估风险因素来采取不同的信贷策略,确定是否给予放贷及额度、利率和期限。本文通过所搜集到的123家中小微企业有信贷记录的关于信誉评级和是否违约数据信息,302家无信贷记录企业的相关数据以及银行贷款年利率和客户流失率的关系2019年统计数据,合理选取指标,依据伯恩斯坦时间之窗理论,利用贝叶斯机器学习,先绘制出123家企业的时间之窗走势图,评估出其信贷风险,从而为银行制定合理的信贷策略。在所求问题得出的结论和模型训练的基础上,利用贝叶斯机器无监督学习模型,得出平滑序列Rt,对302家企业的信息进行数据量化,算出方差及模拟退火后的方差,依据所求的方差和Rt将企业分成四类并分别求出其所占权重,为银行制定信贷策略。本文会考虑新型冠状病毒等突发因素对企业信贷问题产生的影响,检验贝叶斯模型的可靠性,进一步为银行合理地提出信贷调整策略,实现银行利润最大化。 关键词:伯恩斯坦时间之窗理论;贝叶斯机器学习;信贷策略 一、课题背景 某銀行对确定要放贷企业的贷款额度为万元;年利率为4%~15%;贷款期限为1年本文需要根据所搜集到的数据信息,通过建立数学模型,为该银行解决以下问题: 1.对123家企业的信贷风险进行量化分析,给出该银行在年度信贷总额固定时对这些企业的信贷策略。 2.以上一个问题为基础,对302家企业的信贷风险进行量化分析,并给出该银行在年度信贷总额为1亿元时对这些企业的信贷策略。 3.企业的生产经营和经济效益可能会受到一些突发因素影响,而且突发因素往往对不同行业、不同类别的企业会有不同的影响。综合考虑各企业的信贷风险和可能的突发因素(例如:新冠病毒疫情)对各企业的影响,给出该银行在年度信贷总额为1亿元时的信贷调整策略。 二、问题分析 针对上述待解决的三个问题,根据各企业的实际情况,合理选取企业信誉、违约记录、企业实力等重要参考指标,基于伯恩斯坦时间之窗理论,对银行信贷中常见的企业信贷风险问题,建立相对应的贝叶斯算法模型来进行合理的评估。依据评估结果,为银行信贷业务制定全局最优的决策。 由于问题二缺少线性评估,可将机器监督学习优化为无监督学习,对302家企业的数据进行量化处理,求出方差及退火方差,从而将这些企业分成四类并可求出其所占权重,进而为银行制定最优的资源分配方案。 问题三是在前两问的基础上再次加入一些影响银行信贷业务的突发因素,比如新型冠状病毒、自然灾害、公共卫生安全等因素,本文需重新检验模型的可信度,来进行银行信贷策略调整,从而保证银行的利益最大化。 三、模型假设 1.对于客户类型仅分为两种类别,即违约或正常。 2.客户的违约是相互独立的。 3.假设一段时间内社会经济形势总体变化不大。 4.假设现有用户交易数据真实,能真实反映用户数据特征。 四、符号说明 五、模型建立与求解 针对问题一,基于最大后验概率准则的朴素贝叶斯模型算法: 1.首先假设一个n维特征向量,并用这个n维特征向量来表示每个数据样本,分别描述对n个属性S1、S2…、Sn的n个度量。 2.假设有m个已知类,当存在一个未知的数据样本X时(即没有类标号),若运用朴素贝叶斯分类法,m个已知类将被分配给未知的数据样本x,则分配原则 (3)依据经验可知P(X|Ci)的计算非常大,为此,通常假设各属性的取值互相独立,这样先验概率可以从训练数据集求得,有: (4)如果Ai为离散型,则,其中ski是在类Ck属性Ai具有值Xi的训练样本数,而是类Ck的训练样本Sk数。 (5)当且仅当时,样本X被指派为类Ci。 基于最小风险准则的贝叶斯网络算法: 对数据进行贝叶斯网络的结构学习和参数学习,得到贝叶斯分类模型,再基于最小风险准则进行分类决策,对未知类别的样本X计算: 在一个趋势的运行过程中利用时间之窗理论,能够对123家企业的数据信息进行量化分析,运用python软件可绘制出了123家企业的时间之窗并观察企业走势形态。同时基于伯恩斯坦时间之窗理论,根据贝叶斯模型,得出123家企业的方差和Rt值。 增值税是以商品在流转过程中产生的增值额作为计税依据而征收的一种流转税,其计算公式为增值税=销售额+销项税(或进项税)。增值税能够反映企业的经营成效,一般来说企业销售额越大,经营成果越好,应交的增值税额就越大。选取附件中的增值税指标,能够做出移动5天窗口的平滑曲线,进而观测123家企业近3年的企业实力趋势的曲线变化。 综合以上指标以及基于贝叶斯算法得出的Rt值可以把123家有信贷记录的企业分成如下几类: 第一类:企业实力强、信誉好、供求关系稳定、几乎无违约情况,信贷风险小的企业,银行可给予放贷,同时给予利率优惠。包括的企业有E1,E2,E6,E13,E15,E16,E18,E19,E22,E24,E27,E31,E48,E59,E64,E81,E84,E89,E91。 第二类:企业实力较强、信誉良好、供求关系较为稳定、违约情况少的企业,可给予放贷。包括的企业有E5,E10,E12,E23,E30,E32,E34,E37,E38,E45,E51,E57,E58,E61,E62,E63,E67,E70,E71,E76,E83,E85,E93,E106。 第三类:企业实力一般、信誉一般、违约情况较多的企业,银行对于该类企业的放贷决策的制定要更加慎重。包括的企业有E3,E4,E11,E25,E40,E41,E44,E46,E47,E49,E50,E55,E68,E72,E73,E75,E77,E86,E90,E92,E94,E96,E105。 第四类:企业实力较弱、信誉较差、违约情况多的企业,银行可考虑不予放贷。包括的企业有E36,E99,E100,E103,E107,E109,E111,E113,E114,E119,E120。 信贷策略: 基于以上四类企业,并结合相关信贷政策,本文考虑为银行制定以下策略: 1.渗透性定价:对于企业经营状态良好,负债情况稳定,征信记录优良的企业采用渗透性定价,为企业放贷,并为其提供利率优惠,这样银行可以占据更为广阔的市场,虽然利率会有一定的损失,但是由于获得了充足的客户资源,损失的利率会大大减小。 2.差异化定价:差异化定价的模式是十分适合刚刚上市的中小微企业,这种模式的具体做法是对于中小微企业降低一定的利率,从而银行的知名度将会大大提高,这样银行获得客户资源的成本由于银行知名度的提高将会降低,于是此种模式所带来的损失将会由于成本的降低而被弥补。 3.普通定价:这种模式应该应用于生产和管理十分成熟的企业,银行制定合理的信贷策略要考虑企业本身的风险因素。因为对于一些盈利率较高的公司来说从银行获得信贷要考虑许多因素,但是价格因素不是它们最主要考虑的因素。相应地,银行也可用这部分利息收入来平衡其他产品收入的不足,相应降低利率,可很大程度上提高其市场知名度,一旦形成规模效应,可以再次降低银行获客成本,减少的银行获客成本用来补充差异化定价的损失。 针对问题二,基于最小风险准则进行分类决策,最小风险准则贝叶斯分类算法,并训练分类模型,得出302家企业数据的平滑序列Rt、方差及退火方差,根据方差和Rt将这些企业分成四类,其所占权重。基于此四类企业所占份额,合理地根据百分比将1亿元对企业进行配给信贷。 信贷配给策略:银行向四类企业提供贷款的比率分别为:22%、31%、28%、19%。 针对问题三,通过对302家企业的数据进行预处理,可对其中的企业类型进行如下分类:加工制造业、物流运输批发贸易、高科技(含软件、互联网)、电商、建筑业、其它。 2020年新冠肺炎疫情對各行各业的生产经营和经济效益都造成了不同程度的影响,本文综合考虑了所搜集数据中各企业的信贷风险和突发因素如新冠病毒疫情对各企业的影响,通过贝叶斯算法训练数据得到了因突发新冠肺炎疫情对中小微企业市场造成的不利影响(%),可以通过EXCEL表格对这些数据进行可视化处理。 结合以上求解得到的结论,分析该银行在年度信贷总额为1亿元时的信贷调整策略为: 六、模型检验 为了减小模型的误差,使用模拟退火算法来使方差加倍,然后通过多次贝叶斯算法训练数据后使方差趋于很小,从而使模型更加精确。 我们应用贝叶斯算法对302家企业进行了预测,拟合出了关于主要国家的Rt时间估计分布图,放大图形观察发现,大部分企业会出现个别异常的点,但是都能分布在置信区间内部,同时我们还计算出这些主要国家的样本方差,运用模拟退火算法,将方差趋于更小,描绘出302家企业退火前后方差的对比图,发现除了个别企业外,其余企业都接近期望值,说明大部分企业应用贝叶斯的方法对数据预测具有合理性。 七、模型改进 该模型在属性个数比较多或者属性之间相关性较大时,分类效果不好,在某些时候会由于假设的先验模型等原因导致预测效果不佳。模型通过先验和数据来决定后验的概率从而决定分类,所以分类决策存在一定的错误率。贝叶斯模型为有效的监督机器学习模型,更好地考虑了突发因素对于各类中小微企业信贷问题造成的不同程度的影响。 参考文献: [1]韩平.国有商业银行信贷风险生成机理与管理系统研究[R].西安:西安交通大学博士论文,2000. [2]张友棠.财务预警系统管理研究.中国人民大学出版社2007年版. [3]肖北溟.国有商业银行信贷评级模型的构建及实证检验[J].金融论坛,2004,(4):16-21. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。