机器学习

机器学习

@邹博 请问老师无参数回归里面,先验概率该如何假设

回复

机器学习全新升级版I xihajun 发起了问题 • 1 人关注 • 0 个回复 • 59 次浏览 • 2018-10-31 03:00 • 来自相关话题

请问为什么XGBoost用训练集当作测试集来看一下学习的模型准确率和训练不一样

机器学习 fish 回复了问题 • 2 人关注 • 1 个回复 • 85 次浏览 • 2018-10-31 13:33 • 来自相关话题

请问这个图片的代码实现有人知道链接么

回复

Python人工智能 缘媛 发起了问题 • 1 人关注 • 0 个回复 • 204 次浏览 • 2018-09-13 14:43 • 来自相关话题

A,B,C评分卡所用的数据都需要分成观察期和表现期么

回复

机器学习 周彬1ei 发起了问题 • 1 人关注 • 0 个回复 • 277 次浏览 • 2018-09-05 10:48 • 来自相关话题

请问一下,逻辑回归中为什么一定要用sigmoid函数作为转化,可否用其它转换函数替代

回复

机器学习 lxy哆啦A梦 发起了问题 • 1 人关注 • 0 个回复 • 308 次浏览 • 2018-08-29 07:40 • 来自相关话题

训练时将数据进行了标准化,那么预测时,是否也要将预测的数据事先标准化?

机器学习 fish 回复了问题 • 2 人关注 • 1 个回复 • 241 次浏览 • 2018-08-27 14:09 • 来自相关话题

LSTM做时间序列预测的问题

回复

Python zhou2017 发起了问题 • 1 人关注 • 0 个回复 • 349 次浏览 • 2018-08-20 09:24 • 来自相关话题

有人了解过今年数院的BOT人工智能大赛吗?——找队友ing

机器学习 frankswift 发表了文章 • 1 个评论 • 190 次浏览 • 2018-08-10 17:37 • 来自相关话题

学了一年的深度学习理论,目前想找个比赛检测一下实践能力,增加一下比赛经验。之前了解的一些大赛如天池,科赛等,难度有些大。 BOT大赛这次的两个题目我看了一下,挺适合的,“智能汽车”的问题是一个回归问题,预测车流量的,而且数据是上汽集团提供的2000量汽车的出行...
查看更多

LWLR和LASSO、岭回归是什么关系?LWLR是包含LASSO和岭回归吗?

回复

机器学习 JulfoneTony 发起了问题 • 2 人关注 • 0 个回复 • 211 次浏览 • 2018-07-12 16:57 • 来自相关话题

关于随机森林无法正确预测样本的问题。

回复

机器学习 小匿 发起了问题 • 1 人关注 • 0 个回复 • 236 次浏览 • 2018-07-07 01:20 • 来自相关话题

最大似然估计在机器学习里面是什么地位,跟优化算法有什么联系没有?

回复

机器学习 powerwings 发起了问题 • 1 人关注 • 0 个回复 • 296 次浏览 • 2018-06-02 20:36 • 来自相关话题

Word2vec新词以及特征工程

回复

机器学习 whyseu 发起了问题 • 1 人关注 • 0 个回复 • 223 次浏览 • 2018-05-13 17:54 • 来自相关话题

请问在用EM算法在算高斯混合模型前给定了含有几个高斯混合成分,但是在这之前怎么判定含有几个高斯混合成分

机器学习 fish 回复了问题 • 2 人关注 • 1 个回复 • 254 次浏览 • 2018-05-31 13:23 • 来自相关话题

在em算法推导的时候,为什么每次隐变量u的概率会不一样呢?

回复

机器学习 早睡不早起 发起了问题 • 1 人关注 • 0 个回复 • 219 次浏览 • 2018-05-06 23:16 • 来自相关话题

@邹博 谱聚类程序报错 'numpy.ndarray' object has no attribute 'mask'怎么解决????

回复

机器学习 Kobepiv 发起了问题 • 1 人关注 • 0 个回复 • 262 次浏览 • 2018-04-30 17:52 • 来自相关话题

随机森林实践代码运行错误

机器学习 UrBoyZ_ 回复了问题 • 2 人关注 • 1 个回复 • 438 次浏览 • 2018-06-04 17:05 • 来自相关话题

RandomForest代码问题

机器学习全新升级版I UrBoyZ_ 回复了问题 • 3 人关注 • 2 个回复 • 287 次浏览 • 2018-06-04 17:06 • 来自相关话题

K-Means聚类及图像压缩中的reshape

机器学习 泽南Alpha 回复了问题 • 2 人关注 • 1 个回复 • 206 次浏览 • 2018-04-19 16:41 • 来自相关话题

正太分布的最大似然估计 求的方差 表达式 为什么除n

机器学习 Cluluxiu 回复了问题 • 3 人关注 • 2 个回复 • 373 次浏览 • 2018-05-19 22:10 • 来自相关话题

机器学习升级版III之HMM实践程序GMHMM.py报错component 0 of 'full' covars must be symmetric, positive-definite

回复

机器学习 Kobepiv 发起了问题 • 1 人关注 • 0 个回复 • 620 次浏览 • 2018-04-04 23:17 • 来自相关话题

条新动态, 点击查看
首先,@acm79 给出了非常通俗的表达,非常赞!
我画蛇添足一下:
问题:假定有n个1,m个0,则从这(n+m)个数中取到奇数个1的概率有多大呢?
分情况讨论:
(1)如果“n个1”退化成“没有1”,即候选的数都是0,则取到1为奇数是不可能的,概率为0。(这... 显示全部 »
首先,@acm79 给出了非常通俗的表达,非常赞!
我画蛇添足一下:
问题:假定有n个1,m个0,则从这(n+m)个数中取到奇数个1的概率有多大呢?
分情况讨论:
(1)如果“n个1”退化成“没有1”,即候选的数都是0,则取到1为奇数是不可能的,概率为0。(这种情况在2015这个例子中不存在,但在思考题1024中是存在的。)
 
(2)如果“n个1”中的n不为0,那么,题目就是最正常的计算“给定n个1、m个0,从这(n+m)个数中取到奇数个1的概率”,多强调一下,m是否为0不影响分析。
此时,先取到k个1,再随便取若干个0。
(a). 从n个1中取k个1的取法,一共有C(n,k)种取法;
(b). 从n个1中取数的所有取法为2^n;
因此,取到k个的概率为C(n,k)/2^n;
k可以有从0到n的n+1种候选,但我们只关心k取奇数的情况,从而:
k取奇数的概率为:“sigma_k(C(n,k)/2^n),k为奇数”,根据二项式的性质:所有奇数项和偶数项和相等,得到该式子为1/2。
而显然,m是几不关心,上面的1/2就是最终结论。
邹博

邹博 回答了问题 • 2017-05-23 11:10 • 6 个回复 不感兴趣

给@邹博 机器学习的建议

赞同来自:

这是《机器学习·升级版V》课程中的问题。
这个问题放心吧,虽然我会非常强调理论和原理,但我个人是在两个公司做实际的工业实践的,也算了解当前机器学习在工业界到底缺什么。只有前3次会看似非常理论的讲讲数学,相信我:很多同学连最大似然估计都快忘了呢。如果只考虑调包(... 显示全部 »
这是《机器学习·升级版V》课程中的问题。
这个问题放心吧,虽然我会非常强调理论和原理,但我个人是在两个公司做实际的工业实践的,也算了解当前机器学习在工业界到底缺什么。只有前3次会看似非常理论的讲讲数学,相信我:很多同学连最大似然估计都快忘了呢。如果只考虑调包(当然,调包本身非常重要,一定要学会快速合理的调包),有时候不懂原理,还真的不一定能够理性快速有底气的调参。
当然,如果只关心纯实用,可以把重点放在“一次理论,一次实践”的实践环节。
感谢您的问题。

机器学习常用数据集列表

机器学习 群马藤原 回复了问题 • 39 人关注 • 4 个回复 • 3533 次浏览 • 2017-12-05 13:40 • 来自相关话题

近200篇机器学习&深度学习资料分享

资料贴 治肥虫btz 回复了问题 • 97 人关注 • 16 个回复 • 54531 次浏览 • 2017-11-07 18:53 • 来自相关话题

sklearn.feature_extraction.image里的img_to_graph返回值是什么意思?

回复

机器学习 niar 回复了问题 • 3 人关注 • 2 个回复 • 705 次浏览 • 2018-11-11 21:04 • 来自相关话题

请问为什么XGBoost用训练集当作测试集来看一下学习的模型准确率和训练不一样

回复

机器学习 fish 回复了问题 • 2 人关注 • 1 个回复 • 85 次浏览 • 2018-10-31 13:33 • 来自相关话题

@邹博 请问老师无参数回归里面,先验概率该如何假设

回复

机器学习全新升级版I xihajun 发起了问题 • 1 人关注 • 0 个回复 • 59 次浏览 • 2018-10-31 03:00 • 来自相关话题

macro_auc和micro_auc的理论依据是什么

回复

机器学习 a16527 回复了问题 • 3 人关注 • 2 个回复 • 684 次浏览 • 2018-10-18 15:03 • 来自相关话题

8.3iris_LR.py问题出在哪?

回复

机器学习 Cherishamb 回复了问题 • 4 人关注 • 4 个回复 • 3119 次浏览 • 2018-10-10 18:05 • 来自相关话题

请问这个图片的代码实现有人知道链接么

回复

Python人工智能 缘媛 发起了问题 • 1 人关注 • 0 个回复 • 204 次浏览 • 2018-09-13 14:43 • 来自相关话题

A,B,C评分卡所用的数据都需要分成观察期和表现期么

回复

机器学习 周彬1ei 发起了问题 • 1 人关注 • 0 个回复 • 277 次浏览 • 2018-09-05 10:48 • 来自相关话题

请问一下,逻辑回归中为什么一定要用sigmoid函数作为转化,可否用其它转换函数替代

回复

机器学习 lxy哆啦A梦 发起了问题 • 1 人关注 • 0 个回复 • 308 次浏览 • 2018-08-29 07:40 • 来自相关话题

训练时将数据进行了标准化,那么预测时,是否也要将预测的数据事先标准化?

回复

机器学习 fish 回复了问题 • 2 人关注 • 1 个回复 • 241 次浏览 • 2018-08-27 14:09 • 来自相关话题

LSTM做时间序列预测的问题

回复

Python zhou2017 发起了问题 • 1 人关注 • 0 个回复 • 349 次浏览 • 2018-08-20 09:24 • 来自相关话题

机器学习:微积分与概率论思考题-P33页

回复

机器学习 zy99 回复了问题 • 3 人关注 • 4 个回复 • 1159 次浏览 • 2018-07-27 21:41 • 来自相关话题

LWLR和LASSO、岭回归是什么关系?LWLR是包含LASSO和岭回归吗?

回复

机器学习 JulfoneTony 发起了问题 • 2 人关注 • 0 个回复 • 211 次浏览 • 2018-07-12 16:57 • 来自相关话题

关于随机森林无法正确预测样本的问题。

回复

机器学习 小匿 发起了问题 • 1 人关注 • 0 个回复 • 236 次浏览 • 2018-07-07 01:20 • 来自相关话题

请问多分类模型评价指标的选择

回复

数据分析与数据挖掘 a1240663993 回复了问题 • 2 人关注 • 1 个回复 • 441 次浏览 • 2018-07-05 06:05 • 来自相关话题

谱聚类程序报错 'numpy.ndarray' object has no attribute 'mask'怎么解决????

回复

机器学习 a1240663993 回复了问题 • 3 人关注 • 2 个回复 • 815 次浏览 • 2018-07-05 06:01 • 来自相关话题

xgboost中基本分类器为logistic,其一阶导,二阶导推导问题

回复

机器学习 HotHeat 回复了问题 • 3 人关注 • 2 个回复 • 777 次浏览 • 2018-06-24 11:10 • 来自相关话题

RandomForest代码问题

回复

机器学习全新升级版I UrBoyZ_ 回复了问题 • 3 人关注 • 2 个回复 • 287 次浏览 • 2018-06-04 17:06 • 来自相关话题

随机森林实践代码运行错误

回复

机器学习 UrBoyZ_ 回复了问题 • 2 人关注 • 1 个回复 • 438 次浏览 • 2018-06-04 17:05 • 来自相关话题

最大似然估计在机器学习里面是什么地位,跟优化算法有什么联系没有?

回复

机器学习 powerwings 发起了问题 • 1 人关注 • 0 个回复 • 296 次浏览 • 2018-06-02 20:36 • 来自相关话题

请问在用EM算法在算高斯混合模型前给定了含有几个高斯混合成分,但是在这之前怎么判定含有几个高斯混合成分

回复

机器学习 fish 回复了问题 • 2 人关注 • 1 个回复 • 254 次浏览 • 2018-05-31 13:23 • 来自相关话题

有人了解过今年数院的BOT人工智能大赛吗?——找队友ing

机器学习 frankswift 发表了文章 • 1 个评论 • 190 次浏览 • 2018-08-10 17:37 • 来自相关话题

学了一年的深度学习理论,目前想找个比赛检测一下实践能力,增加一下比赛经验。之前了解的一些大赛如天池,科赛等,难度有些大。 BOT大赛这次的两个题目我看了一下,挺适合的,“智能汽车”的问题是一个回归问题,预测车流量的,而且数据是上汽集团提供的2000量汽车的出行...
查看更多

基于分布式云的机器学习

机器学习 唐半张 发表了文章 • 0 个评论 • 1020 次浏览 • 2015-10-11 10:44 • 来自相关话题

一些用户的使用实例还有使用模式等,已经证明使用像微软Azure这样的云服务平台,不能只是存储数据或是做做简单的传统的表面工作,而是应该用上基于云的预报分析的威力和规模,这样,任何公司都将会获益匪浅。三百六十行,行行出数据。使用现代工具,比如Azure机器学习(...
查看更多

大数据分析之机器学习算法实现的演化

机器学习 唐半张 发表了文章 • 0 个评论 • 1254 次浏览 • 2015-10-11 09:51 • 来自相关话题

大数据的广泛应用,着这样的背景下是值得我们研究与学习的。大数据分析 机器学习算法实现的演化 。首先,这里列出了目前可用的三代机器学习工具。 [list=1] 传统的机器学习和 数据分析 的工具,包括SAS,IBM的SPSS,Weka以及R语言。它们可以...
查看更多

我在面试机器学习、大数据岗位时遇到的各种问题

面试经验 木舟 发表了文章 • 3 个评论 • 2397 次浏览 • 2015-09-10 16:43 • 来自相关话题

  自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体...
查看更多

PMML Support in Spark MLlib

机器学习 木舟 发表了文章 • 0 个评论 • 1739 次浏览 • 2015-09-07 17:22 • 来自相关话题

This is a guest blog from our friend Vincenzo Selvaggio who contributed this feature. He is a Senior Java Technical Architect an...
查看更多
  “机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科