重塑熊猫数据框：从一列创建多列

Question

我想重塑以下数据框

进入

有人可以帮我吗？

Answer 1

您是否尝试过df.pivot()或pd.pivot() ？ C列中的值将成为列标题。 之后，展平多索引列，并重命名它们。

import pandas as pd

#df = df.pivot(['A', 'B'], columns='C').reset_index()    #this also works
df = pd.pivot(data=df, index=['A', 'B'], columns='C').reset_index()
df.columns = ['A', 'B', 'X', 'Y']
print(df)

输出

   A   B  X  Y
0  a  aa  1  5
1  b  bb  6  2
2  c  cc  3  7
3  d  dd  8  4

有时，可能存在具有相同索引的重复记录，那么您必须改用pd.pivot_table() 。 参数aggfunc=np.mean将取这些重复记录的平均值，并变成float类型，正如您从输出中看到的那样。

import pandas as pd
import numpy as np

df = pd.pivot_table(data=df, index=['A', 'B'], columns='C', aggfunc=np.mean).reset_index()
df.columns = ['A', 'B', 'X', 'Y']
print(df)

输出

   A   B    X    Y
0  a  aa  1.0  5.0
1  b  bb  6.0  2.0
2  c  cc  3.0  7.0
3  d  dd  8.0  4.0

Answer 2

你可以试试

out = df.pivot(index=['A', 'B'], columns='C', values='D').reset_index()

print(out)

C  A   B  X  Y
0  a  aa  1  5
1  b  bb  6  2
2  c  cc  3  7
3  d  dd  8  4

重塑熊猫数据框：从一列创建多列

问题描述

2 个解决方案

解决方案1
1 2022-06-12 13:32:51

解决方案2
0 2022-06-12 13:55:14

重塑熊猫数据框：从一列创建多列

问题描述

2 个解决方案

解决方案1 1 2022-06-12 13:32:51

解决方案2 0 2022-06-12 13:55:14

解决方案1
1 2022-06-12 13:32:51

解决方案2
0 2022-06-12 13:55:14