决策树那一节的数据大概是怎么生成的呢?长那个样子。想试一下代码

是先做一个左边绿色右边红色的散点图,然后再把几个点换一下吗?还是有什么规律

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自: fish Eric_Jiang

姜老师说的没错。 事实上,我是先随手画一个多边形,然后随机生成该多边形的2千个点。这样就得到一个类别的数据,这些数据都打上标记1。重复这个过程,得到标记2的3000个样本点。从而就可以算作“仿真数据”了。 另外,“在任意多边形内均匀分布随机采样”,这个问题本身,倒是可以琢磨下怎么做。我们在蒙特卡洛采样那次会提一下方法的。

Eric_Jiang - 我是小象的搬运工!!!

赞同来自: fish

其实没必要去纠结老师生成的数据哈,你照着老师的代码做一遍也不一定有好的的效果。 我已经传了很多数据集的网站,你去下下来测试下,遇到问题再去解决才能学到东西。 而且老师生成的数据只是为了讲课,这种数据某种程度上来说是理想的,你在生产中是遇不到的,所以不建议这么做。

要回复问题请先登录注册