阅读 17 SEO

pandas学习笔记之交叉表、透视表

交叉表

交叉表用于计算一列数据对于另一列数据的分组个数,寻找两个列之间的关系。
pd.crosstab(value1, value2)
例如,我们要求解下述数据中,星期几和股票涨跌的关系:

救命数据


  • 将索引中的日期变成星期
    使用下述函数将索引变为星期:
    date = pd.to_datetime(data.index).weekday

    将日期索引转换为星期:0是星期一,1是星期二...


    然后将这串值添加到原数据中:

    添加星期数据列

  • 将涨跌数据转换为0,1,one-hot编码

    编码

  • pd.crosstab()
    下图显示结果:数据表示,
    星期一,股票跌的有574天,涨的有567天;其它依些类推

    结果


    但如果想得到,涨跌的占比呢?

    涨跌占比


    注意,sum()是默认按列求和的,这里修改成按行求和;而div()是默认按列除的,这里修改成按行相除。

  • 成图

    成图


    堆叠

透视表

透视表操作更简单些,能直接得出要分析数据的比例:


数据


image.png



作者:cugliming
链接:https://www.jianshu.com/p/7e6479ff4a69


文章分类
后端
文章标签
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 gxwowoo@163.com 举报,一经查实,本站将立刻删除。
相关推荐