关于pandas的问题


origin.png


result.png

上面第一幅图是我原始的数据,下面一幅图是我想达到的统计结果。我现在就是不知道如何使用pandas的一些功能来达到这种效果。对于pandas中的pivot_table函数我试了下,但是报错了: table=pd.pivot_table(df, index=[u'文件类型', u'内容分析结果']),原因就是我原始数据表格没有多余的列去统计。所以请教下老师,这类问题应该咋做呢?是不是我需要给df添加一列全为1的统计数据呢?谢谢老师。

时间嘚朋

赞同来自:

data['num'] = data.groupby(data['file_type']).agg('sum')试试  下次你可以把数据以可复制的方式粘贴上来,方便回答的人加载,调试

要回复问题请先登录注册