评分卡建模流程
田野老师,您好
最近项目中用到评分卡建模,我现在的流程是数据导入、数据清洗准备、特征工程、特征选择(随机森林得到入参特征)、逻辑回归建模(评估模型准确率,可用后,得到各入参特征的系数)。然后
(1)将入参特征进行woe编码,
(2)根据经验得到Score = q - p * log(odds)中的p、q,并根据经验,得到基础分;
(3)根据各入参特征的woe值及p、q值,计算得到入参特征的各个分箱对于的分数值;
对测试数据,把它对应到每一个入参特征的某一个分箱,得到新数据的每一个特征的分数值,将基础分加上各特征分数,得到新样本的最终分数。然后利用ks检验其可用性,如何ks值达到0.30以上,则投入到生产数据使用。
不知以上流程是否合理?谢谢
最近项目中用到评分卡建模,我现在的流程是数据导入、数据清洗准备、特征工程、特征选择(随机森林得到入参特征)、逻辑回归建模(评估模型准确率,可用后,得到各入参特征的系数)。然后
(1)将入参特征进行woe编码,
(2)根据经验得到Score = q - p * log(odds)中的p、q,并根据经验,得到基础分;
(3)根据各入参特征的woe值及p、q值,计算得到入参特征的各个分箱对于的分数值;
对测试数据,把它对应到每一个入参特征的某一个分箱,得到新数据的每一个特征的分数值,将基础分加上各特征分数,得到新样本的最终分数。然后利用ks检验其可用性,如何ks值达到0.30以上,则投入到生产数据使用。
不知以上流程是否合理?谢谢
3 个回复
田野
赞同来自: 尘埃落定msl
小象老师
赞同来自:
余生有你fsw
赞同来自: