田野

田野

威望 : 17 积分 : 1660 赞同 : 27 感谢 : 2

擅长话题

更多 »回复

2

您好!   首先,我们用的0.7,是一个相对宽松的标准。低于0.7并非没有相关性,而高于0.7几乎肯定会有相关性。   问题1解答:对同一种计算逻辑、但是基于不同时间窗口的变量,2种变量各有利弊。窗口长的变量,例如近30天的查询机构数,IV应该高于7天的。但是...

1

是的,对于可以解释的变量,如年龄,U型的bad rate可以接受。这一点在课堂上也介绍过。

2

你好!   1,一千条数据做对人的征信评分模型,数量不够,经验来讲最好上万。 2,评分是逻辑回归结果的一个线性变换(见下面的公式)。代码里是有的。   score = Base Point + PDO/ln(2)*(-y), y是逻辑回归的结果,是概率的log...

0

在流失率模型里,GBDT的AUC达到86%。在逻辑回归的评分卡里,AUC和KS达到68%和30%。

2

聚类算法可以用来: 1,调整好坏样本的比例 2,变量分箱

更多 »发问

没有内容

发问

回复

文章

最新动态

详细资料

个人成就:

威望: 17 积分: 1660 赞同: 27 感谢: 2

最后活跃:
2018-01-23 11:10
擅长话题:
机器学习 5   0
更多 » 关注 8

傲风寒 ChinaHadoop fish 木舟 admin

更多 » 17 人关注

楼洁7y6 天性与天命 那天的谁 dzhpingbo 风尘浪子

关注 1 话题
主页访问量 : 390 次访问