如何根据另一列值将多个 Panda 的 DataFrame 合并为每个列值的数组

Question

我有几个 Panda 的数据框想要合并在一起。 当我合并它们时，我希望具有相同列的值成为一组值。

例如，如果两个数据框在指定列中具有相同的值，我想将它们合并在一起。 当它们合并时，数据变成一个值数组。

  df1 = 
        A   Value
    0   x   0
    1   y   0


  df2 = 
        A   Value
    0   x   1
    1   y   1
    2   z   1


  After Combining:
  df =
        A   Number_Value 
    0   x   [0, 1]       
    1   y   [0, 1]       
    2   z   [, 1]

我不相信merge()或concat()调用是合适的。 我认为调用 .to_numpy() 可以做到这一点，如果我要将每一行中的每个值转换为一个数组，但这似乎不起作用。

Answer 1

将concat与聚合list一起使用：

df = pd.concat([df1, df2]).groupby('A', as_index=False).agg(list)
print (df)
   A   Value
0  x  [0, 1]
1  y  [0, 1]
2  z     [1]

没有A列的测试数据帧：

L = [df1, df2]
print ([x for x in L if 'A' not in x.columns])

编辑：对于为空值添加''将其添加到fill_value参数：

L = [df1, df2]

df = pd.concat(L, keys=range(len(L))).reset_index(level=1, drop=True).set_index('A', append=True)
mux = pd.MultiIndex.from_product(df.index.levels)
df = df.reindex(mux, fill_value='').groupby('A').agg(list).reset_index()

print (df)

   A   Value
0  x  [0, 1]
1  y  [0, 1]
2  z   [, 1]

如何根据另一列值将多个 Panda 的 DataFrame 合并为每个列值的数组

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-11-04 08:41:57

如何根据另一列值将多个 Panda 的 DataFrame 合并为每个列值的数组

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-11-04 08:41:57

解决方案1
1 已采纳 2021-11-04 08:41:57