如何通过索引重塑多列数据框？

Question

从这里开始。 该解决方案仅适用于一列。 如何改进多列的解决方案。 即如果我有一个像数据帧

df= pd.DataFrame([['a','b'],['b','c'],['c','z'],['d','b']],index=[0,0,1,1])

0  1
0  a  b
0  b  c
1  c  z
1  d  b

如何像他们一样重塑它们

0   1  2  3
0  a  b  b  c 
1  c  z  d  b

如果df是

0  1
0  a  b
1  c  z
1  d  b

然后

0  1   2  3
0  a  b NaN  NaN
1  c  z   d  b

Answer 1

使用flatten/ravel

In [4401]: df.groupby(level=0).apply(lambda x: pd.Series(x.values.flatten()))
Out[4401]:
   0  1  2  3
0  a  b  b  c
1  c  z  d  b

或者， stack

In [4413]: df.groupby(level=0).apply(lambda x: pd.Series(x.stack().values))
Out[4413]:
   0  1  2  3
0  a  b  b  c
1  c  z  d  b

此外，指数不平等

In [4435]: df.groupby(level=0).apply(lambda x: x.values.ravel()).apply(pd.Series)
Out[4435]:
   0  1    2    3
0  a  b  NaN  NaN
1  c  z    d    b

Answer 2

使用groupby + pd.Series + np.reshape ：

df.groupby(level=0).apply(lambda x: pd.Series(x.values.reshape(-1, )))

   0  1  2  3
0  a  b  b  c
1  c  z  d  b

不等数量索引的解决方案 - 改为调用pd.DataFrame构造函数。

df

   0  1
0  a  b
1  c  z
1  d  b

df.groupby(level=0).apply(lambda x: \
      pd.DataFrame(x.values.reshape(1, -1))).reset_index(drop=True)

   0  1    2    3
0  a  b  NaN  NaN
1  c  z    d    b

Answer 3

pd.DataFrame({n: g.values.ravel() for n, g in df.groupby(level=0)}).T

   0  1  2  3
0  a  b  b  c
1  c  z  d  b

这到处都是，我太累了，不能让它漂亮

v = df.values
cc = df.groupby(level=0).cumcount().values
i0, r = pd.factorize(df.index.values)
n, m = v.shape
j0 = np.tile(np.arange(m), n)
j = np.arange(r.size * m).reshape(-1, m)[cc].ravel()
i = i0.repeat(m)

e = np.empty((r.size, m * r.size), dtype=object)

e[i, j] = v.ravel()

pd.DataFrame(e, r)

   0  1     2     3
0  a  b  None  None
1  c  z     d     b

Answer 4

我们试试吧

df1 = df.set_index(df.groupby(level=0).cumcount(), append=True).unstack()
df1.set_axis(labels=pd.np.arange(len(df1.columns)), axis=1)

输出：

   0  1  2  3
0  a  b  b  c
1  c  d  z  b

用NaN输出df：

   0     1  2     3
0  a  None  b  None
1  c     d  z     b

如何通过索引重塑多列数据框？

问题描述

4 个解决方案

解决方案1
3 已采纳 2017-09-28 10:57:19

解决方案2
2 2017-09-28 10:55:41

解决方案3
2 2017-09-28 10:58:47

解决方案4
1 2017-09-28 13:14:27

如何通过索引重塑多列数据框？

问题描述

4 个解决方案

解决方案1 3 已采纳 2017-09-28 10:57:19

解决方案2 2 2017-09-28 10:55:41

解决方案3 2 2017-09-28 10:58:47

解决方案4 1 2017-09-28 13:14:27

解决方案1
3 已采纳 2017-09-28 10:57:19

解决方案2
2 2017-09-28 10:55:41

解决方案3
2 2017-09-28 10:58:47

解决方案4
1 2017-09-28 13:14:27