田野

田野

威望 : 18 积分 : 1690 赞同 : 31 感谢 : 3

擅长话题

更多 »回复

2

如果有明显的序列行为,可用RNN(LSTM),例如行为评分卡。但是带来的问题是可解释性很差。

0

我这边确实没有这种情况。是不是你用的数据集(训练、测试两部分)跟我的不太一样?如果这样的话,你需要改一下相应的代码。我的运行结果的log如下

2

您好!   首先,我们用的0.7,是一个相对宽松的标准。低于0.7并非没有相关性,而高于0.7几乎肯定会有相关性。   问题1解答:对同一种计算逻辑、但是基于不同时间窗口的变量,2种变量各有利弊。窗口长的变量,例如近30天的查询机构数,IV应该高于7天的。但是...

1

是的,对于可以解释的变量,如年龄,U型的bad rate可以接受。这一点在课堂上也介绍过。

2

你好!   1,一千条数据做对人的征信评分模型,数量不够,经验来讲最好上万。 2,评分是逻辑回归结果的一个线性变换(见下面的公式)。代码里是有的。   score = Base Point + PDO/ln(2)*(-y), y是逻辑回归的结果,是概率的log...

0

在流失率模型里,GBDT的AUC达到86%。在逻辑回归的评分卡里,AUC和KS达到68%和30%。

2

聚类算法可以用来: 1,调整好坏样本的比例 2,变量分箱

0

是可以的。确实可以先用RF或者其他方法判断特征重要性然后缩短范围

0

参见最新的代码

0

如果取值少于5,不用分箱,但是要检验单调性。对于不满足单调性的需要合并。参考课上的代码

0

你好,单调性是两个变量间的关系。假设Y是X的映射,如果x1

0

你好!比较重要的是: 1,理解业务场景、人群和产品特点 2,理解已有的反欺诈规则及其存在的不足 3,理解常用的机器学习模型,包括有监督和无监督 具体我们可以加微信私聊

0

你好,请将数据集发给我,谢谢

1

有一点: 数据导入、数据清洗准备、特征工程、将所有特征进行woe编码、特征选择 我们做特征选择,是针对WOE编码后的特征。这是因为放入模型的特征是WOE编码的。

0

你好,最后一次课上会讲。

0

可以。例如xgboost,当需要给样本设置权重时,可以用如下方式[code=Java]w = np.random.rand(5,1) dtrain = xgb.DMatrix( data, label=label, missing = -999.0, weig...

0

评分跟概率的转换,给我们课上的讲的公式是一致的: score = base point + PDO/ln(2)(-y)   部署方式可以将训练好的gbdt模型保存成pickle文件。后续调用这个文件即可。

0

所谓单调,对于一个序列只有2种情况: 1,每一个元素不小于前面的元素,或者 2,每一个元素不大于前面的元素。   除此之外都是不单调。

更多 »发问

没有内容

更多 »动态

发问

回复

文章

最新动态

我的交易

类型 时间 数额 支付方式 状态 描述

提现记录

时间 金额 卡号 银行 持卡人 手续费 状态 描述

审核记录

时间 类型 状态 描述
更多 » 关注 8

傲风寒 ChinaHadoop fish 木舟 admin

更多 » 25 人关注

bigdatafhz xiaoming1 Glare qwshy 唐少

关注 1 话题
主页访问量 : 2677 次访问