如何按索引顺序拆分pandas.DataFrame？

Question

如果我有两个pandas.DataFrame具有相同的列。

df1 = pd.DataFrame(np.random.rand(5, 6), columns=list('abcdef'))
df2 = pd.DataFrame(np.random.rand(5, 6), columns=list('abcdef'))

我将它们连接成一个：

df = pd.concat([df1, df2], ignore_index = False)

现在不会忽略索引值。

在我不执行更改索引值的情况下执行某些数据操作后，如何反转连接，以便最终再次显示两个数据帧的列表？

Answer 1

我建议在concat使用keys

df = pd.concat([df1, df2], ignore_index = False,keys=['df1','df2'])
df
Out[28]: 
              a         b         c         d         e         f
df1 0  0.426246  0.162134  0.231001  0.645908  0.282457  0.715134
    1  0.973173  0.854198  0.419888  0.617750  0.115466  0.565804
    2  0.474284  0.757242  0.452319  0.046627  0.935915  0.540498
    3  0.046215  0.740778  0.204866  0.047914  0.143158  0.317274
    4  0.311755  0.456133  0.704235  0.255057  0.558791  0.319582
df2 0  0.449926  0.330672  0.830240  0.861221  0.234013  0.299515
    1  0.552645  0.620980  0.313907  0.039247  0.356451  0.849368
    2  0.159485  0.620178  0.428837  0.315384  0.910175  0.020809
    3  0.687249  0.824803  0.118434  0.661684  0.013440  0.611711
    4  0.576244  0.915196  0.544099  0.750581  0.192548  0.477207

转换回来

df1,df2=[y.reset_index(level=0,drop=True) for _, y in df.groupby(level=0)]
df1
Out[30]: 
          a         b         c         d         e         f
0  0.426246  0.162134  0.231001  0.645908  0.282457  0.715134
1  0.973173  0.854198  0.419888  0.617750  0.115466  0.565804
2  0.474284  0.757242  0.452319  0.046627  0.935915  0.540498
3  0.046215  0.740778  0.204866  0.047914  0.143158  0.317274
4  0.311755  0.456133  0.704235  0.255057  0.558791  0.319582

Answer 2

如果你不喜欢没有groupby，你可以使用它。

list_dfs = [df1, df2]
df = pd.concat(list_dfs, ignore_index = False)

new_dfs = []
counter = 0
for i in list_dfs:
    new_dfs.append(df[counter:counter+len(i)])
    counter += len(i)

如何按索引顺序拆分pandas.DataFrame？

问题描述

2 个解决方案

解决方案1
6 已采纳 2018-12-30 05:00:31

解决方案2
2 2018-12-30 04:43:38

如何按索引顺序拆分pandas.DataFrame？

问题描述

2 个解决方案

解决方案1 6 已采纳 2018-12-30 05:00:31

解决方案2 2 2018-12-30 04:43:38

解决方案1
6 已采纳 2018-12-30 05:00:31

解决方案2
2 2018-12-30 04:43:38