[英]Python Pandas Dataframe Pivot Table Column and Values Order
长时间的 XLS 用户仍然是 Python/Pandas 的新手。我想自动化一些价格曲线的报告,但我无法以我正在寻找的格式获得 Pivot。 在此先感谢您的帮助!
我有一个这种格式的数据框:
data = [['AAA',1,11,1,],['AAA',2,12,2],['AAA',3,13,3],
['BBB',1,21,5],['BBB',2,22,6],['BBB',3,23,7],
['CCC',1,31,9],['CCC',2,32,10],['CCC',3,33,11]]
df = pd.DataFrame(data, columns = ['Curve', 'Tenor','Price','Change'])
print(df)
Curve Tenor Price Change
0 AAA 1 11 1
1 AAA 2 12 2
2 AAA 3 13 3
3 BBB 1 21 5
4 BBB 2 22 6
5 BBB 3 23 7
6 CCC 1 31 9
7 CCC 2 32 10
8 CCC 3 33 11
我按如下方式旋转了 df,结果如下所示:
df2 = pd.pivot_table(df, values=['Price','Change'], index='Tenor',columns='Curve', aggfunc=np.mean)
Change Price
Curve AAA BBB CCC AAA BBB CCC
Tenor
1 1 5 9 11 21 31
2 2 6 10 12 22 32
3 3 7 11 13 23 33
我希望它更改列分组的顺序,使其看起来像
AAA BBB CCC
Tenor Price Change Price Change Price Change
1 11 1 5 21 31 9
2 12 2 6 22 32 10
3 13 3 7 23 33 11
在 XLS 中,您只需在 Pivot 中物理地移动字段。 我相信它在这里也同样微不足道:)但无论我如何谷歌,我似乎都找不到解决方案。 再次感谢你的帮助! 任何和所有的帮助表示赞赏。 干杯。
我们可以通过swaplevel
、 sort_index
和reindex
来重新组织标题:
df2 = (
df.pivot_table(values=['Price', 'Change'], index='Tenor', columns='Curve')
.swaplevel(axis=1)
.sort_index(level=0, axis=1)
.reindex(['Price', 'Change'], level=1, axis=1)
.rename_axis(columns=[None, None])
)
df2
:
AAA BBB CCC
Price Change Price Change Price Change
Tenor
1 11 1 21 5 31 9
2 12 2 22 6 32 10
3 13 3 23 7 33 11
swaplevel
切换级别 0 和级别 1 中的值(因此 AAA、BBB、CCC 成为顶级索引)sort_index
将按字典顺序对新的顶级AAA
BBB
CCC
排序(我们也可以通过.reindex(['AAA', 'BBB', 'CCC'], level=0, axis=1)
为该级别提供特定顺序.)reindex
将“价格”放在“更改”之前,因为排序不起作用,因为“更改”按字母顺序排在“价格”之前rename_axis
去除旋转时创建的轴名称“Curve”。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.