评分卡建模流程

田野老师,您好
最近项目中用到评分卡建模,我现在的流程是数据导入、数据清洗准备、特征工程、特征选择(随机森林得到入参特征)、逻辑回归建模(评估模型准确率,可用后,得到各入参特征的系数)。然后
(1)将入参特征进行woe编码,
(2)根据经验得到Score = q - p * log(odds)中的p、q,并根据经验,得到基础分;
(3)根据各入参特征的woe值及p、q值,计算得到入参特征的各个分箱对于的分数值;
对测试数据,把它对应到每一个入参特征的某一个分箱,得到新数据的每一个特征的分数值,将基础分加上各特征分数,得到新样本的最终分数。然后利用ks检验其可用性,如何ks值达到0.30以上,则投入到生产数据使用。
 
不知以上流程是否合理?谢谢
 

小象老师

赞同来自:

老师今天晚上看下这个问题。

田野

赞同来自:

有一点: 数据导入、数据清洗准备、特征工程、将所有特征进行woe编码、特征选择 我们做特征选择,是针对WOE编码后的特征。这是因为放入模型的特征是WOE编码的。

要回复问题请先登录注册