@Robin_TY:请问pandas的get_dummies和OneHotEncoder有什么区别?

@Robin_TY老师,
如题,我有点糊涂了,
pandas里的get_dummies和OneHotEncoder有什么区别呢?
他们的使用场景有什么不同呢?
谢谢

Robin_TY - PhD@CSU,研究方向:计算机视觉,模式识别

赞同来自: 土湾老袍哥 fish

pandas中的get_dummies和sklearn中的OneHotEncoder()的结果是一样的。 但是区别就在于,OneHotEncoder()适用于多个集合的情况,如:训练集和测试集;而get_dummies只适用于一个数据集情况。   试想下:sklearn中的OneHotEncoder()在训练集上得到的编码器是需要再用于测试集中相应的数据上的,所以OneHotEncoder()有两个方法,1. fit_transform(), 2. transform(),也就是说这两个集合使用的是同一套编码。 而get_dummies不能这样操作,只能用于一个数据集上数据的转换。

要回复问题请先登录注册