arima模型适用范围(不能不知小微最常见的两大场景模型)

12月8日,翻开今年的日历,2021还有半个多月即将过去了,最后一个月不到的时间让我们抓住剩余的时间尾巴,好好过一个精彩(摸鱼)的12月。 番茄风控近期开播了小微风控的内容,近期跟星球的同...

12月8日,翻开今年的日历,2021还有半个多月即将过去了,最后一个月不到的时间让我们抓住剩余的时间尾巴,好好过一个精彩(摸鱼)的12月。

番茄风控近期开播了小微风控的内容,近期跟星球的同学交流,大家比较感兴趣在小微模型,今日跟大家分享在小微风控上的两大模型:营收预估模型与逾期预测模型。

一.营收预估模型

1.1.模型背景

在企业的经营场景中,我们总是希望利用企业历史的经营数据去预测未来的经营情况。比如在用过去2~3年的数据预测未来1年的实际营业额,于是基于这样的场景需求,我们就有了营收预估模型的内容。

在营收预估类的模型中,我们一直有两大类算法在使用,一个是线性回归类模型,另一个是ARIMA模型(时间序列分析模型),这两类模型预估营收上有些不同,具体请看以下内容:

1.2.模型场景的比较:

对于营业额预估不同的趋势预测使用的模型不一样,以实际的检验的方法去找出最适合企业的营业额预测的一个方法,ARIMA模型(时间序列分析)在营业额波动性比较大的企业比较适合。

线性回归模型在营业额趋势比较明显的企业比较适合,在用过去2~3年的数据预测过去1年的实际营业额,我们使用实际数据去校验模型的准确性,来选择合适的模型进行实际未来1年营业额的预测。

在实际的小微数据的预估中,实际测试下来,我们总结了以下的规律:

30%的企业适合时间序列模型,

30%的企业适合线性回归模型,

剩余40%经营平稳的企业更适合移动平均的估计。

在对预测方法在实际数据中测试在选择后,超过80%的客户准确率都能控制在误差正负20%以内,预测10个客户里面有8个预测100万,上下浮动不超过百分之二十,上不超过120w,下不低于80w。实际的数据测试,测试出来的准确度是符合业务生产需求的。

1.3.模型涉及字段:

不能不知—小微最常见的两大场景模型

1.4.预测结果对比

ARIMA模型整体预测误差率在每个百分位点值均小于线性回归,可见ARIMA模型对营收预测更准确;

ARIMA预测准确率:92.3%;

线性回归预测准确率:89.4%;

不能不知—小微最常见的两大场景模型

二.逾期预测模型

2.1.模型背景

逾期概率预测其针对的客户基本上就是非银或者银行,预测的是他贷了一笔款以后,最后还不出贷款的概率是多少。

这个应用了很多数据,比如企业基本信息、成立年限、注册资本、工商司法、报税销售额,这些信息全部综合在一起,通过这些信息去预测它最后贷款会不会违约的概率,这个主要是用逻辑回归

2.2.模型的输出模型

客户逾期概率[0-1]

比如通过逾期模型,预估出广东某有限责任公司,贷款逾期概率0.00051,逾期风险较低。

通过逾期概率的预估,我们判断出逾期的概率情况,并且逾期的情况仍可以通过划分区间等级。

2.3.模型涉及字段:

不能不知—小微最常见的两大场景模型

【节选部分字段】

2.4.预测结果对比

结合我们之前的开发数据情况,通过之前的一些模型数据统计,在训练样本的预测上模型的结果参考指标:

不能不知—小微最常见的两大场景模型

以上模型参考的来自于企业纳税数据(国税局),企业的纳税适用范围在年销售额亿万级别,产品幅度可达100万。

在小微风控模型上除了以上两大常见的模型外,另外还有:

③经营欺诈模型

④提款率(余额)预测模型

其中经营欺诈模型就是基于客户开票信息,来预测客户虚假经营的风险;而余额预测模型基于历史申请客户实际提款情况,结合企业基本信息、工商信息、财税信息来预测余额和提款率的模型,剩余的两部分后续有机会再跟大家介绍。

关于本次提到的,几大小微风控相关的模型,更详细的内容关注:《第二期小微风控训练营》,本次训练营我们又更新了小微企业的模型+企业征信相关的内容:

不能不知—小微最常见的两大场景模型

另外在本文中涉及的企业征信纳税字段,本次也有相关内容在知识星球平台供大家学习,可以到上面查收。

不能不知—小微最常见的两大场景模型

不能不知—小微最常见的两大场景模型

不能不知—小微最常见的两大场景模型

~原创文章

...

end

  • 发表于 2022-11-01 15:21:47
  • 阅读 ( 1794 )
  • 分类:科技

0 条评论

请先 登录 后评论
林健辉
林健辉

304 篇文章

你可能感兴趣的文章

相关问题