关于sklearn中决策树算法的predict_proba问题

看了下sklearn决策树算法的predict_proba接口,它的解释是输出一个样本属于某个类的概率。但是我所理解的,每一个样本在给定的决策树下,最终应该只会属于一个类别,那也就是意味着这个样本属于那个类别的概率就应该是100%啊。那predict_proba这个接口是怎么计算所谓的概率的呢?不知道我是不是哪里理解错了。请老师指教!谢谢老师!

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自: 不带毛的兔子 fish

这是《机器学习·升级版IV》中“决策树和随机森林”章节的问题。 答案非常简单:因为叶子节点是“纯结点”,假定某个叶子包含的三个类别的样本个数分别是(7,2,1),则如果某测试样本落在这个结点中,它判定这三个类别的概率分别是(0.7,0.2,0.1)。

要回复问题请先登录注册