arima模型适用范围（不能不知小微最常见的两大场景模型）-万思特网

12月8日，翻开今年的日历，2021还有半个多月即将过去了，最后一个月不到的时间让我们抓住剩余的时间尾巴，好好过一个精彩（摸鱼）的12月。

番茄风控近期开播了小微风控的内容，近期跟星球的同学交流，大家比较感兴趣在小微模型，今日跟大家分享在小微风控上的两大模型：营收预估模型与逾期预测模型。

一.营收预估模型

1.1.模型背景

在企业的经营场景中，我们总是希望利用企业历史的经营数据去预测未来的经营情况。比如在用过去2～3年的数据预测未来1年的实际营业额，于是基于这样的场景需求，我们就有了营收预估模型的内容。

在营收预估类的模型中，我们一直有两大类算法在使用，一个是线性回归类模型，另一个是ARIMA模型（时间序列分析模型），这两类模型预估营收上有些不同，具体请看以下内容：

1.2.模型场景的比较：

对于营业额预估不同的趋势预测使用的模型不一样，以实际的检验的方法去找出最适合企业的营业额预测的一个方法，ARIMA模型（时间序列分析）在营业额波动性比较大的企业比较适合。

线性回归模型在营业额趋势比较明显的企业比较适合，在用过去2～3年的数据预测过去1年的实际营业额，我们使用实际数据去校验模型的准确性，来选择合适的模型进行实际未来1年营业额的预测。

在实际的小微数据的预估中，实际测试下来，我们总结了以下的规律：

30%的企业适合时间序列模型，

30%的企业适合线性回归模型，

剩余40%经营平稳的企业更适合移动平均的估计。

在对预测方法在实际数据中测试在选择后，超过80%的客户准确率都能控制在误差正负20%以内，预测10个客户里面有8个预测100万，上下浮动不超过百分之二十，上不超过120w，下不低于80w。实际的数据测试，测试出来的准确度是符合业务生产需求的。

1.3.模型涉及字段：

1.4.预测结果对比

ARIMA模型整体预测误差率在每个百分位点值均小于线性回归，可见ARIMA模型对营收预测更准确；

ARIMA预测准确率：92.3%；

线性回归预测准确率：89.4%；

二.逾期预测模型

2.1.模型背景

逾期概率预测其针对的客户基本上就是非银或者银行，预测的是他贷了一笔款以后，最后还不出贷款的概率是多少。

这个应用了很多数据，比如企业基本信息、成立年限、注册资本、工商司法、报税销售额，这些信息全部综合在一起，通过这些信息去预测它最后贷款会不会违约的概率，这个主要是用逻辑回归

2.2.模型的输出模型

客户逾期概率[0-1]

比如通过逾期模型，预估出广东某有限责任公司，贷款逾期概率0.00051,逾期风险较低。

通过逾期概率的预估，我们判断出逾期的概率情况，并且逾期的情况仍可以通过划分区间等级。

2.3.模型涉及字段：

【节选部分字段】

2.4.预测结果对比

结合我们之前的开发数据情况，通过之前的一些模型数据统计，在训练样本的预测上模型的结果参考指标：

以上模型参考的来自于企业纳税数据(国税局)，企业的纳税适用范围在年销售额亿万级别,产品幅度可达100万。

在小微风控模型上除了以上两大常见的模型外，另外还有：

③经营欺诈模型

④提款率（余额）预测模型

其中经营欺诈模型就是基于客户开票信息，来预测客户虚假经营的风险；而余额预测模型基于历史申请客户实际提款情况，结合企业基本信息、工商信息、财税信息来预测余额和提款率的模型，剩余的两部分后续有机会再跟大家介绍。

关于本次提到的，几大小微风控相关的模型，更详细的内容关注：《第二期小微风控训练营》，本次训练营我们又更新了小微企业的模型+企业征信相关的内容：

另外在本文中涉及的企业征信纳税字段，本次也有相关内容在知识星球平台供大家学习，可以到上面查收。

~原创文章

...

end

0 条评论