[英]denormalize csv file with python / pandas dataframe
我有一個csv文件結構為:
Location Parameter
A 10
A 20
B 14
B 16
C 15
C 9
C 6
我可以使用read_csv輕松地將其傳入數據幀。
我想使用python / pandas轉換數據幀以獲取A,B,C中的每一個的列,並通過相應的參數填充值,例如
A B C
10 14 15
20 16 9
NA NA 6
最終目標是在數據框上做一個箱形圖。
提前致謝。
我無法找到正確的旋轉/堆疊方法 - 其他人可能會想出正確的方法 - 所以我又回到了groupby
:
>>> df
Location Parameter
0 A 10
1 A 20
2 B 14
3 B 16
4 C 15
5 C 9
6 C 6
>>> cd = {k: v.reset_index(drop=True) for k,v in df.groupby("Location")["Parameter"]}
>>> pd.DataFrame(cd)
A B C
0 10 14 15
1 20 16 9
2 NaN NaN 6
要制作一個箱形圖,groupby的結果就足夠了:
grouped = data.groupby('Location')
grouped.boxplot(subplots=False)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.