6.6features代码

if __name__ == '__main__':
    stype = 'pca'
    pd.set_option('display.width', 200)
    data = pd.read_csv('iris.data', header=None)
    # columns = np.array(['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'type'])
    columns = np.array([u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度', u'类型'])
    data.rename(columns=dict(zip(np.arange(5), columns)), inplace=True)
    data[u'类型'] = pd.Categorical(data[u'类型']).codes
    print data.head(5)
    x = data[columns[:-1]]
    y = data[columns[-1]]
    if stype == 'pca':
        pca = PCA(n_components=2, whiten=True, random_state=0)
        x = pca.fit_transform(x)
        print '各方向方差:', pca.explained_variance_
        print '方差所占比例:', pca.explained_variance_ratio_
        x1_label, x2_label = u'组分1', u'组分2'
        title = u'鸢尾花数据PCA降维'
    else:
        fs = SelectKBest(chi2, k=2)
        # fs = SelectPercentile(chi2, percentile=60)
        fs.fit(x, y)
        idx = fs.get_support(indices=True)
        print 'fs.get_support() = ', idx
        x = x[idx]
        x = x.values    # 为下面使用方便,DataFrame转换成ndarray
        x1_label, x2_label = columns[idx]
        title = u'鸢尾花数据特征选择'
    print x[:5]
最后输出的x[:5]指的是什么

缘媛

赞同来自:

最后输出的x[:5]指的是什么

邹博 - 计算机科学博士,深谙机器学习算法原理

赞同来自:

这是《机器学习·升级版V》中“数据清洗与特征选择”章节的配套代码问题。 这里的x[:5]只是输出前5个样本而已,类似于Pandas中的data.head()。

要回复问题请先登录注册