鸢尾花二分类10.3代码中的问题


在10.3 Iris_LR.py中
 
第69行代码
 x, y = np.split(data.values, (4,), axis=1)的意思是什么

第75行代码
 x[:, :2]怎么理解选择了x的前两列特征
第77行代码

('clf', LogisticRegression()) ])是什么意思

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自: tevin Jar_Sweet

这是《机器学习升级版III》中“回归实践”的配套代码中的问题。 1、x, y = np.split(data.values, (4,), axis=1)的意思是:将data按照列划分成两部分,从第0列到第3列赋值给x,第4列到最后的所有列赋值给y。——而鸢尾花数据其实只有0到4列,所以,y本质是150行1列的数据。 2、 x[:, :2]怎么理解选择了x的前两列特征:这是Python语言本身的基本问题,第一个冒号表示所有行都取,第二个“:2”表示从第0列到第1列取,因此,会返回前2列的数据。这里更细致的数据处理可以参考“Python基础”那次课的前1小时介绍。 3、('clf', LogisticRegression()) ])是什么意思:这里是对LogisticRegression这个类和字符串'clf'组成一个元组,这其实是Pipleline的第二部分:
lr = Pipeline([('sc', StandardScaler()),
               ('clf', LogisticRegression()) ])

要回复问题请先登录注册