繁体   English   中英

Pandas DataFrame MultiIndex Pivot - 删除空标题和轴行

[英]Pandas DataFrame MultiIndex Pivot - Remove Empty Headers and Axis Rows

这与我之前在这里提出的问题密切相关Python Pandas Dataframe Pivot Table Column and Values Order 再次感谢您的帮助。 非常感谢。

我正在尝试自动化一份报告,该报告将通过电子邮件分发给大量受众,因此它需要看起来“漂亮”:)

我在重置/删除索引和/或轴后枢轴时遇到问题,无法使用 .style CSS 函数(即从 df 中创建样式器对象)来使表格看起来不错。

我有一个 DataFrame,其中两个主要字段(在我的示例中它们是“Name”和“Bucket”)将是可变的。 所需的显示顺序也会改变(因此不能硬编码),但它可以在应用程序的早期(例如“Name_Rank”和“Bucket_Rank”)导出为可以轻松排序的整数“排序值”(和理论上后来下降)。

我可以删除列排序值,但不能删除行/标题/轴(?)。 此外,无论我尝试什么,我似乎都无法摆脱标题和数据表之间的空白行。

我(认为)我需要设置 Index = Bucket 和 Headers = "Name" 和 "TDY/Change" 以正确使用 .style 样式对象功能。

    import pandas as pd
    import numpy as np

    data = [
    ['AAA',2,'X',3,5,1],
    ['AAA',2,'Y',1,10,2],
    ['AAA',2,'Z',2,15,3],
    ['BBB',3,'X',3,15,3],
    ['BBB',3,'Y',1,10,2],
    ['BBB',3,'Z',2,5,1],
    ['CCC',1,'X',3,10,2],
    ['CCC',1,'Y',1,15,3],
    ['CCC',1,'Z',2,5,1],
    ]

    df = pd.DataFrame(data, columns = 
    ['Name','Name_Rank','Bucket','Bucket_Rank','Price','Change'])

    display(df)
姓名 姓名_排名 Bucket_Rank 价钱 改变
0 AAA 2 X 3 5 1
1 AAA 2 1 10 2
2 AAA 2 Z 2 15 3
3 BBB 3 X 3 15 3
4 BBB 3 1 10 2
5 BBB 3 Z 2 5 1
6 CCC 1 X 3 10 2
7 CCC 1 1 15 3
8 CCC 1 Z 2 5 1

根据先前的问题/答案,我几乎可以将表格变成正确的格式:

    df2 = (pd.pivot_table(df, values=['Price','Change'],index=['Bucket_Rank','Bucket'], 
    columns=['Name_Rank','Name'], aggfunc=np.mean)
        .swaplevel(1,0,axis=1)
        .sort_index(level=0,axis=1)
        .reindex(['Price','Change'],level=1,axis=1)
        .swaplevel(2,1,axis=1)
        .rename_axis(columns=[None,None,None])
        ).reset_index().drop('Bucket_Rank',axis=1).set_index('Bucket').rename_axis(columns= 
         [None,None,None])

看起来像这样:

1 2 3
CCC AAA BBB
价钱 改变 价钱 改变 价钱 改变
15 3 10 2 10 2
Z 5 1 15 3 5 1
X 10 2 5 1 15 3

好吧,那么...

A)我如何摆脱曾经是“Name_Rank”的行/标题/轴(?)(例如整数“排序值”1,2,3)。 我想出了一个技巧,将 df 导出到 XLS/使用 Header=(1,2) 重新导入,但这不是实现目标的最佳方式。

B) 如何去掉表格中数据上方的空白行? 从我在网上阅读的内容来看,您似乎应该“rename_axis=[None]”,但是无论我尝试哪种顺序,这似乎都不起作用。

C) 有没有办法设置标题,使以前的“名称”和“价格/更改”行都是标题,以便可以使用 .style 功能将它们与中的数据分开格式化下表?

非常感谢任何人可能提出的任何建议。 我完全被困住了!

干杯,德文郡

在 pandas 1.4.0 中,A 和 B 的选项可以使用Styler.hide方法直接获得:

在此处输入图片说明

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM