[英]Dataframe - convert rows to columns - grouped by another columns
我正在寻找如下转换数据框
原始数据集
团体 | 英里 |
---|---|
一个 | 23 |
一个 | 20 |
一个 | 24 |
一个 | 25 |
乙 | 12 |
乙 | 17 |
乙 | 16 |
乙 | 19 |
我想从上述格式转换为:
可乐 | Col_B |
---|---|
23 | 12 |
20 | 17 |
24 | 16 |
25 | 19 |
pivot
尝试:df = df.assign(t= df.groupby('Group').cumcount()).pivot(index = 't', columns ='Group', values = 'Miles').add_prefix('Col_').rename_axis(columns = None).reset_index(drop = True)
pd.concat
:k = pd.concat([g.reset_index(drop=True)['Miles'] for _,g in df.groupby('Group')], 1)
k.columns = ['colA', 'colB']
set_index
/ unstack
的另一种选择:k = df.set_index(['Group', df.groupby('Group').cumcount()]).unstack(0).add_prefix('Col_').rename_axis(columns= [None,None])
k.columns = k.columns.droplevel()
groupby
/ explode
:k = df.groupby('Group').agg(list).T.apply(pd.Series.explode).add_prefix('Col_')
k = k.reset_index(drop=True).rename_axis(columns = None)
Col_A Col_B
0 23 12
1 20 17
2 24 16
3 25 19
一个pivot_table
选项:
df = (
df.pivot_table(index=df.groupby('Group').cumcount(),
columns='Group',
values='Miles')
.add_prefix('Col_')
.rename_axis(columns=None)
)
df
:
Col_A Col_B
0 23 12
1 20 17
2 24 16
3 25 19
解释:
使用groupby cumcount
根据每个组中的相对 position 创建一个新索引:
df.groupby('Group').cumcount()
Group new_index
A 0
A 1
A 2
A 3
B 0
B 1
B 2
B 3
然后Group
可以成为宽格式 Frame 中的新列。
df.pivot_table(index=df.groupby('Group').cumcount(),
columns='Group',
values='Miles')
Group A B
0 23 12
1 20 17
2 24 16
3 25 19
然后使用add_prefix
+ rename_axis
进行一些清理:
df.pivot_table(index=df.groupby('Group').cumcount(),
columns='Group',
values='Miles')
.add_prefix('Col_')
.rename_axis(columns=None)
Col_A Col_B
0 23 12
1 20 17
2 24 16
3 25 19
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.