Pandas創建多個聚合

Question

試着看看這與熊貓有多么難或多么容易。

假設有一列有兩列數據，例如：

如你所見， A和C有三個共同的元素1, 2, 3 。 B然而僅具有兩個元件1和2， D只有一個元素：4。

如何以編程方式獲得相同的結果。 這個想法是讓每個小組以某種方式返回。 因此， [A, C]和[1, 2, 3] ，然后[B]和[1, 2]和[D]與[4] 。

我知道可以編寫一個程序來做這個，所以我想弄清楚Pandas上是否有東西要做，而不必從頭開始構建東西。

謝謝！

Answer 1

您可以使用groupby兩次來實現此目的。

df = df.groupby('Cat1')['Cat2'].apply(lambda x: tuple(set(x))).reset_index()
df = df.groupby('Cat2')['Cat1'].apply(lambda x: tuple(set(x))).reset_index()

我正在使用tuple因為pandas需要元素才能進行分組才能進行groupby 。 上面的代碼不區分(1, 2, 3)和(1, 1, 2, 3) 。 如果你想進行這種區分，頂替set與sorted 。

結果輸出：

        Cat2    Cat1
0     (1, 2)    (B,)
1  (1, 2, 3)  (A, C)
2       (4,)    (D,)

Answer 2

你也可以：

df = df.set_index('Cat1', append=True).unstack().loc[:, 'Cat2']
df = pd.Series({col: tuple(values.dropna()) for col, values in df.items()})
df = df.groupby(df.values).apply(lambda x: list(x.index))

要得到

                   Cat1
(1.0, 2.0)          [B]
(1.0, 2.0, 3.0)  [A, C]
(4.0,)              [D]

Pandas創建多個聚合

問題描述

2 個解決方案

解決方案1
3 2016-05-11 23:01:22

解決方案2
0 2016-05-11 22:59:44

Pandas創建多個聚合

問題描述

2 個解決方案

解決方案1 3 2016-05-11 23:01:22

解決方案2 0 2016-05-11 22:59:44

解決方案1
3 2016-05-11 23:01:22

解決方案2
0 2016-05-11 22:59:44