12月8日,翻开今年的日历,2021还有半个多月即将过去了,最后一个月不到的时间让我们抓住剩余的时间尾巴,好好过一个精彩(摸鱼)的12月。
番茄风控近期开播了小微风控的内容,近期跟星球的同学交流,大家比较感兴趣在小微模型,今日跟大家分享在小微风控上的两大模型:营收预估模型与逾期预测模型。
一.营收预估模型
1.1.模型背景
在企业的经营场景中,我们总是希望利用企业历史的经营数据去预测未来的经营情况。比如在用过去2~3年的数据预测未来1年的实际营业额,于是基于这样的场景需求,我们就有了营收预估模型的内容。
在营收预估类的模型中,我们一直有两大类算法在使用,一个是线性回归类模型,另一个是ARIMA模型(时间序列分析模型),这两类模型预估营收上有些不同,具体请看以下内容:
1.2.模型场景的比较:
对于营业额预估不同的趋势预测使用的模型不一样,以实际的检验的方法去找出最适合企业的营业额预测的一个方法,ARIMA模型(时间序列分析)在营业额波动性比较大的企业比较适合。
线性回归模型在营业额趋势比较明显的企业比较适合,在用过去2~3年的数据预测过去1年的实际营业额,我们使用实际数据去校验模型的准确性,来选择合适的模型进行实际未来1年营业额的预测。
在实际的小微数据的预估中,实际测试下来,我们总结了以下的规律:
30%的企业适合时间序列模型,
30%的企业适合线性回归模型,
剩余40%经营平稳的企业更适合移动平均的估计。
在对预测方法在实际数据中测试在选择后,超过80%的客户准确率都能控制在误差正负20%以内,预测10个客户里面有8个预测100万,上下浮动不超过百分之二十,上不超过120w,下不低于80w。实际的数据测试,测试出来的准确度是符合业务生产需求的。
1.3.模型涉及字段:
1.4.预测结果对比
ARIMA模型整体预测误差率在每个百分位点值均小于线性回归,可见ARIMA模型对营收预测更准确;
ARIMA预测准确率:92.3%;
线性回归预测准确率:89.4%;
二.逾期预测模型
2.1.模型背景
逾期概率预测其针对的客户基本上就是非银或者银行,预测的是他贷了一笔款以后,最后还不出贷款的概率是多少。
这个应用了很多数据,比如企业基本信息、成立年限、注册资本、工商司法、报税销售额,这些信息全部综合在一起,通过这些信息去预测它最后贷款会不会违约的概率,这个主要是用逻辑回归
2.2.模型的输出模型
客户逾期概率[0-1]
比如通过逾期模型,预估出广东某有限责任公司,贷款逾期概率0.00051,逾期风险较低。
通过逾期概率的预估,我们判断出逾期的概率情况,并且逾期的情况仍可以通过划分区间等级。
2.3.模型涉及字段:
【节选部分字段】
2.4.预测结果对比
结合我们之前的开发数据情况,通过之前的一些模型数据统计,在训练样本的预测上模型的结果参考指标:
以上模型参考的来自于企业纳税数据(国税局),企业的纳税适用范围在年销售额亿万级别,产品幅度可达100万。
在小微风控模型上除了以上两大常见的模型外,另外还有:
③经营欺诈模型
④提款率(余额)预测模型
其中经营欺诈模型就是基于客户开票信息,来预测客户虚假经营的风险;而余额预测模型基于历史申请客户实际提款情况,结合企业基本信息、工商信息、财税信息来预测余额和提款率的模型,剩余的两部分后续有机会再跟大家介绍。
关于本次提到的,几大小微风控相关的模型,更详细的内容关注:《第二期小微风控训练营》,本次训练营我们又更新了小微企业的模型+企业征信相关的内容:
另外在本文中涉及的企业征信纳税字段,本次也有相关内容在知识星球平台供大家学习,可以到上面查收。
~原创文章
...
end