[英]Save pandas pivot_table to include index and columns names
我想保存一個DataFrame.to_csv
數據透視表供人類閱讀,但DataFrame.to_csv
不包含DataFrame.columns.name
。 我怎樣才能做到這一點?
示例:
對於以下數據透視表:
>>> import pandas as pd
>>> df = pd.DataFrame([[1, 2, 3], [6, 7, 8]])
>>> df.columns = list("ABC")
>>> df.index = list("XY")
>>> df
A B C
X 1 2 3
Y 6 7 8
>>> p = pd.pivot_table(data=df, index="A", columns="B", values="C")
查看數據透視表時,我們有索引名稱(“A”)和列名稱(“B”)。
>>> p
B 2 7
A
1 3.0 NaN
6 NaN 8.0
但是當導出為 csv 時,我們會丟失列名:
>>> p.to_csv("temp.csv")
===temp.csv===
A,2,7
1,3.0,
6,,8.0
如何獲得某種人類可讀的輸出格式,其中包含整個數據透視表,包括.columns.name
(“B”)?
像這樣的事情會很好:
B,2,7
A,,
1,3.0,
6,,8.0
是的,可以通過 append helper DataFrame 來實現,但是讀取文件有點復雜:
p1 = pd.DataFrame(columns=p.columns, index=[p.index.name]).append(p)
p1.to_csv('temp.csv',index_label=p.columns.name)
B,2,7
A,,
1,3.0,
6,,8.0
#set first column to index
df = pd.read_csv('temp.csv', index_col=0)
#set columns and index names
df.columns.name = df.index.name
df.index.name = df.index[0]
#remove first row of data
df = df.iloc[1:]
print (df)
B 2 7
A
1 3.0 NaN
6 NaN 8.0
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.