DataFrame groupby 2 列 und 計數出現在第三

Question

我正在嘗試將 DataFrame 按兩列分組，並計算第三列中出現的差異。 到目前為止，我得到的是：

import pandas as pd

df = pd.DataFrame({'colA': ['name1', 'name2', 'name2', 'name4', 'name2', 'name5'], 'colB': ['red', 'yellow', 'yellow', 'black', 'yellow', 'green'], 'colC': ['value1', 'vlaue2', 'value2', 'value4', 'value5', 'value6']})

df_grouped = df.groupby(["colA", "colB"])["colC"].count()

print(df_grouped)

其中 output 是：

colA   colB  
name1  red       1
name2  yellow    3
name4  black     1
name5  green     1

我想要做的是，將 colA 和 colB 視為 1 列並計算（並顯示）colC 中不同值的出現。 所以在這種情況下應該是：

    colA    colB    colC  count  
0  name1     red  value1  1
1  name2  yellow  vlaue2  2
2                 value5  1
3  name4   black  value4  1
4  name5   green  value6  1

提前致謝。

Answer 1

如果我理解正確，您只需按 3 列 A、B 和 C 分組：

df_grouped = df.groupby(["colA", "colB","colC"])["colC"].count().reset_index(name="count")

Output :
>
    colA    colB    colC  count
0  name1     red  value1      1
1  name2  yellow  value2      2
2  name2  yellow  value5      1
3  name4   black  value4      1
4  name5   green  value6      1

DataFrame groupby 2 列 und 計數出現在第三

問題描述

1 個解決方案

解決方案1
1 2021-11-19 23:25:48

DataFrame groupby 2 列 und 計數出現在第三

問題描述

1 個解決方案

解決方案1 1 2021-11-19 23:25:48

解決方案1
1 2021-11-19 23:25:48