邹老师,怎么从数据上看,选线性模型还是选非线性模型呢@邹博

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自:

这个是不确定的。比如我们在《机器学习升级版I/II》中,我们经常使用的鸢尾花数据,下面分别是Logistic回归、决策树、随机森林、朴素贝叶斯、SVM、EM算法的分类结果:   Logistic回归:
1479642193049.png
  决策树:
1479642223766.png
  随机森林:
1479642249895.png
  朴素贝叶斯:
1479642290733.png
  SVM:
1479642348061.png
  EM:
1479642390549.png
  从上面的结果可以看到,由于鸢尾花数据中,其中一个类别跟另外两个是线性可分,而另外两个线性不可分。各个算法的确会造成一定的区别,但选择线性算法(Logistic回归、SVM)还是非线性算法(决策树、随机森林、朴素贝叶斯)甚至无监督算法(EM)都是有可能的。实践中,需要根据问题的难易程度和算法效能来综合衡量。

猪猪1

赞同来自:

你好,鸢尾花数据库可以分享给我吗,谢谢  

要回复问题请先登录注册