数据集的划分

请老师讲解一下:这分别代表四参数,是怎样赋值,我应该怎样理解这就话,请老师解答一下,谢谢
X_train, X_test, y_train, y_test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/4, random_state=0)
TIM截图20180416153126.jpg

Robin_TY - PhD@CSU,研究方向:计算机视觉,模式识别

赞同来自: happy520 fish

train_test_split() http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html 是将所有的特征X和对应的所有标签y按照指定的比例进行划分。这里test_size=1/4表示1/4的数据作为测试集,那么3/4为训练集。   所以得到的X_train来自与3/4的X,X_test来自与1/4的X;同理 y_train来自与3/4的y,y_test来自与1/4的y。  

要回复问题请先登录注册