孙静懿1,冯由玲2,罗庆2
(1.长春金融高等专科学校文化基础教研部,吉林2.吉林财经大学管理科学与信息工程学院,吉林
长春130028;长春130117)
[摘要]以中小微企业为研究对象,基于有信誉记录的中小微企业数据,通过K-means算法对企业的经
济实力做聚类分析,构建风险系数衡量指标并进行回归分析,构建有信誉记录的信贷决策模型。基于无信誉记录的中小微企业数据,根据企业票据交易关系用聚类方法为企业分类,通过回归方程计算负票占有率、金额变动值和重复成交率之间的关系,对企业借贷能力进行评分,构建无信誉借贷决策模型,并在此模型基础上,通过回归方程对突发因素情况下企业有效利润进行计算,从而对企业借贷能力进行评分,构建突发因素无信誉借贷决策模型,为各类信贷机构的贷款策略提供参考。
[关键词]决策模型;K-means聚类分析;回归模型;决策树[中图分类号]F832.4;F276.3[文献标识码]A[收稿日期]2021-04-15[文章编号]1671-6671(2021)03-0005-11[基金项目]吉林省教育厅项目(JJKH20210142SK)[作者简介]孙静懿(1979-),女,吉林长春人,长春金融高等专科学校文化基础教研部主任,副教授,研究方向:金融数学。冯由玲(1979-),女,吉林长春人,吉林财经大学管理科学与信息工程学院教授,研究方向:数据挖掘与优化决策。
一、中小微企业的信贷决策面临困境
近年来,中小微企业迅速发展,企业数量已大致达到企业总数量的90%,提供了超过80%的就业岗
[1]
位、创造了60%以上的GDP,对于推动社会经济有重要作用。与大型企业相较,中小微企业具有风险大、[2]单笔业务金额小的特点,因此开发与其相适应的信贷决策模型以辅助贷款成为各类信贷机构的迫切需求。
本文以2020年全国大学生数学建模竞赛中提供的中小微企业数据为数据源,利用数据挖掘方法建立一个完整的信贷决策模型,对中小微企业的信贷风险进行评估,为各类信贷机构是否进行放贷、
[3]贷款额度以及期限等贷款策略提供参考。
二、中小微企业信贷决策模型构架
(一)模型假设
1.公司有能力偿还所有贷款金额及产生的利息。
JournalofChangchunFinanceCollege
05
一一一一一一学报一一一一一一一一一一一一2.在销项信息中负数表示顾客对企业产品不满意而导致退货,若销项信息中负数过多,则表示企业产品与信誉存在一定问题;在进项信息中负数表示企业对厂商产品不满意而导致退货,若进项信息中负数过多,则表示企业信誉也存在一定问题。
3.在销项信息中,若重复顾客购买次数多,则说明顾客愿意购买该企业的商品,表示该企业有较好的信誉;在进项信息中,若重复合作商家次数多,则说明合作商家愿意与该企业长期合作,表示该企业有较好的信誉。
(二)信贷决策模型构建思路
对于有信誉记录的中小微企业,整理企业交易票据的关系与数额,分析企业实力与供求关系,计算出该企业的收益系数,比较历年收益,预测企业未来盈利趋势,在此基础上,比较企业信誉等级以及该企业是否违约,可根据其信誉等级调整年利率。信贷总额固定总值不确定,在保障风险一定的前提
[4]
下实现银行收益最大化,构建信贷策略及额度分配策略,建立该银行在年度信贷总额固定时的有信
誉记录的信贷决策模型。
对于无信贷记录的企业,在有信誉记录的企业所建立的有信誉记录的信贷决策模型的基础上,验
[5]证无信誉记录的信贷决策模型的性、正态性、同方差性和线性四个方面的诊断统计量,适当调
整信誉评级在决策模型中的比重,调整对风险较大企业的贷款评级,合理分配贷款。
在面对突发情况时,结合实际,针对不同程度的突发情况对不同行业的影响程度,参考国家统计局记录、各行业报表等数据,用突发因素无信誉借贷决策模型预测各企业效益的变动,严格把控信贷
[6]风险,在企业收入减少的前提下维持各行业正常生产。见图1。
图1信贷决策模型
三、有信誉记录的中小微企业信贷策略
依据企业经济实力与投资风险因素为评价标准,通过聚类分析与线性回归的方法建立有信誉记
[7-8]录的信贷决策模型,以下为银行信贷评价与决策模型的建立过程:
(一)基于K-means算法对企业经济实力进行聚类分析
1.对数据的处理:在进项信息与销项信息的表格中提取每个企业在每一年的有效票据,计算每个企业每年的销项与进项金额之差(W利润),作为评判企业经济实力的衡量指标。06
JournalofChangchunFinanceCollege
一一一一一一一一一2021年第3期(总第158期)一一一一一一一一一一一一一一一一一一2.聚类分析:利用R软件,以每个企业这五年的利润数据对123家企业进行聚类分析,将企业划分为四类。分类结果图形见图2:
图2聚类分析结果图
由聚类结果可看出,123家企业按照资金波动范围以及资金波动幅度分为以上四类,得到每家企业这五年的有效利润的平均值作为经济实力的衡量指标,对比图如图3:
图3企业经济实力对比
JournalofChangchunFinanceCollege
07
一一一一一一学报一一一一一一一一一一一一图4后三类具体变化区间
由图4可知,四个区间有明显清晰的层次划分,按照每一层次经济实力水平,将贷款额度上限依次分为100万、80万、60万和40万,且与每一层次企业经济实力分类一一对应。
(二)构造风险系数衡量指标
1.对数据的处理:①负数占有率:利用进项信息与销项信息分别计算每个企业每年的进项和销项的负数数量与有效数量,并分别求出进项和销项的每年负数占有率,在假设2的前提下,按照进项∶销项=4∶6的比,算出每个企业的负数率,作为衡量企业信誉的指标。②金额变动值:利用所求的每个企业的每年利润额求其利润的标准差,作为衡量数据变动幅度的指标。③重复成交率:利用进项信息与销项信息分别计算每个企业每年的重复合作对象成交次数与总有效成交次数,分别求出进项和销项每年的重复成交率,在假设3的前提下,按照进项∶销项=1∶9的比,算出每个企业的成交重复率,作为衡量企业信誉的指标。④信誉评级与是否违约:将信誉评级的四类分别数量化(A:100,B:80,C:60,D:40),将是否违约0-1化(是:1,否:0)。
2.建立回归模型:以信誉评级为因变量,以负数占有率、金额变动值、重复成交率和是否违约为自变量,利用R软件建立回归模型,具体回归模型如下:
Credit=60.808+12.31*StaCus-36.46*Defaut
由回归结果可知,重复成交率,是否违约和常数项都是显著的,负数所占比例、金额变动值是不显著的,根据回归模型计算每家公司的预测信誉得分(Predit)。
(三)模型检验
回归方程诊断:根据已建立的多元回归模型考虑随机误差性、正态性、同方差性和线性四个方面的诊断统计量,得出残差-拟合图(ResidualsvsFitted),正态QQ图(NormalQ-Q),大小-位置图08
JournalofChangchunFinanceCollege
一一一一一一一一一2021年第3期(总第158期)一一一一一一一一一一一一一一一一一一(Scale-Location),残差-杠杆图(ResidualsvsLeverage)(见图5)。
图5回归模型检验结果
(1)从线性ResidualsvsFitted残差图与拟合图可以看出,两个变量不完全属于随机分布模式,反而呈现三个较为明显的线性相关,这说明残差值与拟合值没有任何系统关联,在日后的建模中可以考
[9]
虑对这个信贷回归模型添加二次项构造更合理的回归模型。
(2)从正态Q-Q图中可以看出,除了4号、110号和115号观测值,其他点基本落在直线上,表明残差符合正态分布。
(3)从同方差性Scale-Location位置尺度图上,我们可以看出,大部分的观测值都是以小组形式存
[10]
在,但不是在一个小组,同残差图与拟合图问题一致,需要加入二次项进行优化。
(4)从残差杠杆图中可以鉴别出离群点,如号观测值和115号观测值是高杠杆值点和强影响点离群点,表明拟合回归模型对这两个观测值预测效果不佳。
JournalofChangchunFinanceCollege
09
一一一一一一学报一一一一一一一一一一一一4.结果分析
表1
经济实力聚类一类
风险参数βA级:β≥80B级:60≤β<80C级:40≤β<60D级:β<40
聚类三类
A级:β≥80B级:60≤β<80C级:40≤β<60D级:β<40
有信誉记录的决策模型结果
经济实力聚类二类
风险参数βA级:β≥80B级:60≤β<80C级:40≤β<60D级:β<40
聚类四类
A级:β≥80B级:60≤β<80C级:40≤β<60D级:β<40
借贷策略(单位:万)额度:10∼80利率:4.00%∼5.85%
额度:10∼80利率:5.85%∼8.25%
额度:10∼80利率:8.25%∼11.05%
额度:10∼80利率:11.05%∼15.00%
额度:10∼60利率:4.00%∼5.85%
额度:10∼60利率:5.85%∼8.25%
额度:10∼60利率:8.25%∼11.05%
额度:10∼60利率:11.05%∼15.00%
借贷策略(单位:万)额度:10∼100利率:4.00%∼5.85%额度:10∼100利率:5.85%∼8.25%额度:10∼100利率:8.25%∼11.05%
额度:10∼100利率:11.05%∼15.00%
额度:10∼60利率:4.00%∼5.85%
额度:10∼60利率:5.85%∼8.25%
额度:10∼60利率:8.25%∼11.05%
额度:10∼60利率:11.05%∼15.00%
由表1有信誉记录的决策模型结果分析可知,银行信贷决策模型通过对企业经济实力的分层及风险因素的介入,把企业贷款额度分为四个层次,依据每一层次中信誉评级占比把贷款年利率分为四个阶段。
如图6所示,第一类信誉评级B和C占比量大,同时考虑信誉评级A的客户流失率的变化,从而判定第一类的贷款年利率为4.00%—5.85%。
图6第一类信誉评级占比图7第二类信誉评级占比
10
JournalofChangchunFinanceCollege
一一一一一一一一一2021年第3期(总第158期)一一一一一一一一一一一一一一一一一一如图7所示,第二类信誉评级B占比最大,同时考虑信誉评级A和C的客户流失率的变化从而判定第二类的贷款年利率为5.85%—8.25%。
如图8所示,第三类信誉评级A占比量为零,评级D的占比量最大,评级B和评级C的占比均较小,同时考虑信誉评级D的客户流失率的变化,从而判定第三类的贷款年利率为8.25%—11.05%。
表2
第四类信誉评级
第四类信誉评级个数
100806040
00014
占比0.00%0.00%0.00%100%
图8第三类信誉评级占比
如表2所示,第四类信誉评级均在D级,且均违约,所以不考虑对这些企业进行借贷。
四、没有信誉记录的中小微企业的信贷策略
根据上述建立的有信誉数据回归方程,结合302家无信誉记录的企业聚类分析结果建立决策模型,以下为无信誉数据银行信贷评价与决策模型的建立过程。
(一)构建样本回归模型
以信誉评级为因变量,以负数占有率、金额变动值、重复成交率为自变量,对数据进行标准化处理后,利用R软件建立回归模型,具体结果如下所示:
Credit=48.65+59.6NegNum+29.32StaCus
(二)通过K-means算法对302家企业的经济实力做聚类分析
1.对数据的处理:在进项信息与销项信息的表格中提取每个企业在每一年的有效票据计算每个企业每年的销项与进项金额之差(W利润),作为评判企业经济实力的衡量指标。
2.聚类分析:利用R软件,以每个企业这五年的利润数据对302家企业进行聚类分析,将企业划分为四类。根据所得数据,做出四个层次经济实力对比图。
从图9可以看出,四个层次的分级还比较明显,可以代表不同层次的经济实力水平。(三)以样本回归模型计算每个公司的风险评估指标
将302家企业的负数占有率、回头客客户占有率带入信誉预值回归方程(Credit=48.65+59.6NegNum+29.32StaCus)中,得到每个公司的信息预值,作为估算该公司的信誉信息,成为信贷决策的风险指标。图10是对302家信誉预值结果的正态分布分析结果,信息预值基本符合正态分布规律。
JournalofChangchunFinanceCollege
11
一一一一一一学报一一一一一一一一一一一一图9302家企业经济实力评估
图10信誉预值正态拟合图
(四)结果分析
银行在年度信贷总额为1亿元时,对这些企业的信贷策略如下:根据聚类分析得出的四个层次,通过企业经济实力均值以及企业个数的比较,将四个层次的信贷额度调整为100万、80万、60万和40万,再根据无信誉数据的信贷决策模型计算信誉估值正态分布情况,将每个层次分为三类,分别是信誉预值小于55、介于55与77之间和大于77的三个范围,每个小区间的额度再次依据总体标准差来计算每个区间的具体额度,具体信贷策略决策树模型如表3。12
JournalofChangchunFinanceCollege
一一一一一一一一一2021年第3期(总第158期)一一一一一一一一一一一一一一一一一一表3
经济实力
信誉预值βA级:β≥77聚类一类B级:55≤β<77C级:β<55A级:β≥77聚类三类B级:55≤β<77C级:β<55无信誉记录的决策模型结果分析
经济实力聚类二类
信誉预值βA级:β≥77B级:55≤β<77C级:β<55聚类四类
A级:β≥77B级:55≤β<77C级:β<55借贷策略(单位:万)额度:10∼80额度:10∼60额度:10额度:10∼40额度:10∼30额度:10
借贷策略(单位:万)额度:10∼100额度:10∼80额度:10额度:10∼60额度:10∼40额度:10
五、应对突发因素无信誉数据的信贷决策模型
以302家企业无信誉数据的信贷决策模型为基础,结合突发因素对不同行业、不同类别企业产生的影响建立决策模型,以下为应对突发因素无信誉数据的信贷决策模型:
(一)模型构建
(1)以302家企业无信誉数据的信贷决策模型为基础,构建样本回归模型并进行回归方程诊断,通过K-means聚类算法对302家企业进行聚类分析,根据所构建的回归模型计算每个公司风险评估指标。
(2)以样本回归模型计算每个企业突发因子评测指标。
通过对302家企业疫情期间(2019.12—2020.2)及往年对应时间内所得利润进行回归模型计算,得到每个企业在突发因素下的总体标准差σi,样本标准差σ(见图11)。
图11302家企业拟突发状况折线图
JournalofChangchunFinanceCollege
13
一一一一一一学报一一一一一一一一一一一一(二)结果分析
表4
经济实力
信誉预值β
突发因子σ-σ<σi<σA级:β≥77
-2σ<σi<-σσ<σi<2σ-3σ<σi<-2σ2σ<σi<3σσi<-3σ或σi>3σ-σ<σi<σA级:β≥77
-2σ<σi<-σσ<σi<2σ-3σ<σi<-2σ2σ<σi<3σσi<-3σ或σi>3σ应对突发因素无信誉数据分析借贷策略(单位:万)额度:10∼100额度:10∼80
聚类二类
额度:10∼60额度:10额度:10∼60额度:10∼40
聚二类
额度:10∼30额度:10
A级:β≥77A级:β≥77
经济实力
信誉预值β
突发因子σ-σ<σi<σ-2σ<σi<-σσ<σi<2σ-3σ<σi<-2σ2σ<σi<3σσi<-3σ或σi>3σ-σ<σi<σ-2σ<σi<-σσ<σi<2σ-3σ<σi<-2σ2σ<σi<3σσi<-3σ或σi>3σ借贷策略(单位:万)额度:10∼100额度:10∼80
聚类一类
B级:55≤β<77C级:β<55
B级:55≤β<77C级:β<55
额度:10∼60额度:10额度:10∼40额度:10∼30
聚类三类
B级:55≤β<77C级:β<55
B级:55≤β<77C级:β<55
额度:10∼20额度:10
在突发因素和银行年度信贷总额为1亿元时,针对这些企业制定的信贷策略如下:根据聚类分析得出的四个层次,通过企业经济实力均值以及企业个数的比较,将四个层次的信贷额度调整为100万、80万、60万和40万,根据无信誉数据的信贷决策模型所计算信誉估值正态分布情况,将每个层次分为三类,分别是信誉预值小于55、介于55与77之间和大于77的三个范围,再根据突发因子信贷决策模型所计算的突发因子估值正态分布情况,将每个层次分为四个等级,每个小区间的额度再次依据总体标准差来计算每个区间的具体额度,具体信贷策略决策模型如表4所示。
六、总结
信誉等级的信贷决策模型参考了企业的经济实力规模、企业负数票据的占有率、企业利润变动幅度、企业回头客户比率等参考指标,结合信誉等级,较为全面地为企业进行贷款风险评估,具有一定的参考意义。无信誉等级的信贷决策模型,通过对样本的分析,得出了估计信誉等级回归模型,使银行借贷对企业有一定信誉评判标准,且该标准也符合正态分布。参考文献:
[1]宋雨轩,刘雅雅.基于DANP方法的中小微企业银行信贷风险分析评估[J].科技经济导刊,2021,29(5):59-
60.
[2]蒋辉,马豪杰,许旭庆,兰秋军.信贷业务初期小微企业信用评估指标确权策略与方法[J].财经理论与实践,
2019,40(3):39-45.
14
JournalofChangchunFinanceCollege
一一一一一一一一一2021年第3期(总第158期)一一一一一一一一一一一一一一一一一一[3]严冠,刘志东.基于贝叶斯方法的中国商业银行同业借贷网络中系统风险研究[J].中国管理科学,2020,28
(4):14-26.
[4]程秀丽,田圆.中小微企业的信贷决策[J].中小企业管理与科技(中旬刊),2021(2):160-161.[5]周羽浩,蔡昊达.基于中小微企业的信贷决策研究[J].产业科技创新,2019,1(20):85-86.
[6]欧阳文杰,陆岷峰.新冠病毒疫情下中小微企业韧性与弹力研究——基于不可抗力背景下中小微企业的生存
视角[J].长春金融高等专科学校学报,2020(2):75-86.
[7]杨真真,岳佳鑫,张振桐.贝叶斯算法在企业信贷决策中的应用[J].中国科技信息,2020(24):104-105.[8]谢豪,陈颖佳,李丹,兰佳琦.层次分析法在网络借贷中的应用[J].教育现代化,2016,3(5):249-250.[9]费宇.多元统计分析——基于R[M].北京:中国人民大学出版社,2015.[10]王斌会.多元统计分析及R语言建模[M].北京:高等教育出版社,2020.
ResearchonCreditEvaluationDecisionofMicroSmalland
MediumSizedEnterprisesBasedonDataMining
SUNJing-yi1,FENGYou-ling2,LUOQing2
(1.DepartmentofCulturalFoundation,ChangchunFinanceCollege,Changchun130028,China;2.SchoolofManagementScienceandInformationEngineering,JilinUniversityofFinanceandEconomics,
Changchun130117,China)
Absrtact:Takingmicrosmallandmedium-sizedenterprisesastheresearchobject,basedonthedataofsmallandmedium-sizedmicroenterpriseswithcreditrecords,thispaperusesk-meansalgorithmtodoclusteranalysisontheeconomicstrengthofenterprises,constructsriskcoefficientmeasurementindexandregressionanalysis,andconstructscreditdecision-makingmodelwithcreditrecords.Basedonthedataofmicrosmallandmediumenterpriseswithnocreditrecord,accordingtothetransactionrelationshipofen-terprisebills,thispaperusestheclusteringmethodtoclassifyenterprises,andcalculatestherelationshipamongnegativeticketoccupancyrate,amountchangevalueandrepeatedtransactionratethroughregres-sionequation,soastoscoretheenterprise'slendingability,onthebasisofthismodel,theeffectiveprofitofenterprisesundersuddenfactorsiscalculatedbyregressionequation,soastoscoretheenterprise'slend-ingability,andbuildthedecisionmodelofsuddenfactors'creditlesslending,soastoprovidereferenceforthelendingstrategiesofvariouscreditinstitutions.
Keywords:decisionmodel;K-meansclusteranalysis;regressionmodel;decisiontree
[责任编辑:王
帅]
JournalofChangchunFinanceCollege
15
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- baoaiwan.cn 版权所有 赣ICP备2024042794号-3
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务