[英]Pandas DataFrame MultiIndex Pivot - Remove Empty Headers and Axis Rows
这与我之前在这里提出的问题密切相关Python Pandas Dataframe Pivot Table Column and Values Order 。 再次感谢您的帮助。 非常感谢。
我正在尝试自动化一份报告,该报告将通过电子邮件分发给大量受众,因此它需要看起来“漂亮”:)
我在重置/删除索引和/或轴后枢轴时遇到问题,无法使用 .style CSS 函数(即从 df 中创建样式器对象)来使表格看起来不错。
我有一个 DataFrame,其中两个主要字段(在我的示例中它们是“Name”和“Bucket”)将是可变的。 所需的显示顺序也会改变(因此不能硬编码),但它可以在应用程序的早期(例如“Name_Rank”和“Bucket_Rank”)导出为可以轻松排序的整数“排序值”(和理论上后来下降)。
我可以删除列排序值,但不能删除行/标题/轴(?)。 此外,无论我尝试什么,我似乎都无法摆脱标题和数据表之间的空白行。
我(认为)我需要设置 Index = Bucket 和 Headers = "Name" 和 "TDY/Change" 以正确使用 .style 样式对象功能。
import pandas as pd
import numpy as np
data = [
['AAA',2,'X',3,5,1],
['AAA',2,'Y',1,10,2],
['AAA',2,'Z',2,15,3],
['BBB',3,'X',3,15,3],
['BBB',3,'Y',1,10,2],
['BBB',3,'Z',2,5,1],
['CCC',1,'X',3,10,2],
['CCC',1,'Y',1,15,3],
['CCC',1,'Z',2,5,1],
]
df = pd.DataFrame(data, columns =
['Name','Name_Rank','Bucket','Bucket_Rank','Price','Change'])
display(df)
姓名 | 姓名_排名 | 桶 | Bucket_Rank | 价钱 | 改变 | |
---|---|---|---|---|---|---|
0 | AAA | 2 | X | 3 | 5 | 1 |
1 | AAA | 2 | 是 | 1 | 10 | 2 |
2 | AAA | 2 | Z | 2 | 15 | 3 |
3 | BBB | 3 | X | 3 | 15 | 3 |
4 | BBB | 3 | 是 | 1 | 10 | 2 |
5 | BBB | 3 | Z | 2 | 5 | 1 |
6 | CCC | 1 | X | 3 | 10 | 2 |
7 | CCC | 1 | 是 | 1 | 15 | 3 |
8 | CCC | 1 | Z | 2 | 5 | 1 |
根据先前的问题/答案,我几乎可以将表格变成正确的格式:
df2 = (pd.pivot_table(df, values=['Price','Change'],index=['Bucket_Rank','Bucket'],
columns=['Name_Rank','Name'], aggfunc=np.mean)
.swaplevel(1,0,axis=1)
.sort_index(level=0,axis=1)
.reindex(['Price','Change'],level=1,axis=1)
.swaplevel(2,1,axis=1)
.rename_axis(columns=[None,None,None])
).reset_index().drop('Bucket_Rank',axis=1).set_index('Bucket').rename_axis(columns=
[None,None,None])
看起来像这样:
1 | 2 | 3 | ||||
---|---|---|---|---|---|---|
CCC | AAA | BBB | ||||
价钱 | 改变 | 价钱 | 改变 | 价钱 | 改变 | |
桶 | ||||||
是 | 15 | 3 | 10 | 2 | 10 | 2 |
Z | 5 | 1 | 15 | 3 | 5 | 1 |
X | 10 | 2 | 5 | 1 | 15 | 3 |
好吧,那么...
A)我如何摆脱曾经是“Name_Rank”的行/标题/轴(?)(例如整数“排序值”1,2,3)。 我想出了一个技巧,将 df 导出到 XLS/使用 Header=(1,2) 重新导入,但这不是实现目标的最佳方式。
B) 如何去掉表格中数据上方的空白行? 从我在网上阅读的内容来看,您似乎应该“rename_axis=[None]”,但是无论我尝试哪种顺序,这似乎都不起作用。
C) 有没有办法设置标题,使以前的“名称”和“价格/更改”行都是标题,以便可以使用 .style 功能将它们与中的数据分开格式化下表?
非常感谢任何人可能提出的任何建议。 我完全被困住了!
干杯,德文郡
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.