邹博

邹博

计算机科学博士,深谙机器学习算法原理

威望 : 538 积分 : 8230 赞同 : 425 感谢 : 133

擅长话题

更多 »回复

0

这是《机器学习(升级版)》中“提升”章节的问题。 问的非常好,这里的p-y.label,其实只是梯度的“公共部分”,因为不同的样本要乘以各自的样本值,所以是无法提前算出来的,因此往往用p-y.label计算梯度的系数部分,实际拿到样本,再乘以各自的数据。

0

这是《机器学习(升级版)》“回归”章节的问题。 它的应用很多的,凡是目标标记是连续的预测场景:如房价、股票价格、温湿度等,都有可能使用该模型;但使用时要注意它是无参模型,会导致模型复杂并且可能过拟合。

0

这是《机器学习(升级版)》中“回归”章节的问题。 可以这么认为,下图中的曲线是等值线,如果采用L1-norm的可行域,最小值发生在(0,1)处,显然w1=0;但如果采用L2-norm的可行域,最小值时w1,w2在第一象限,都不为0。从而L1在某些情况下,具有一...

0

这是《机器学习(升级版)》中“数据清洗和特征选择”章节的配套代码的问题。 这里的0.95就是做特征选择中的,我的初衷是:“只选择最大的前若干特征,丢弃占比小于5%的后面那些特征”。 另外,这里的0.95只是拍脑门啦——说的好听些,叫“调参”的结果。

0

前半句没问题。所以“二者本质相同”并不太合适。 举个可能不十分恰当的例子:就像“求取真经”和“九九八十一难”的感觉一样。

更多 »发问

12

5609 次浏览  • 50 个关注   • 2016-08-13

1

765 次浏览  • 2 个关注   • 2016-07-11

4

3978 次浏览  • 26 个关注   • 2016-05-13

发问

回复

文章

最新动态

详细资料

个人成就:

威望: 538 积分: 8230 赞同: 425 感谢: 133

最后活跃:
2017-09-19 17:56
擅长话题:
机器学习 369   66
算法 24   9
python 15   7
深度学习 5   1
爬虫 3   1
面试算法 1   0
spark 1   0
r 1   1
统计 1   0
更多 » 关注 12

admin Dong bmchs wangwensheng mopishv0

更多 » 16961 人关注

翟锟 Jsoulan 刘利华 liulihua21 准AI教授

关注 0 话题
主页访问量 : 6390 次访问