如何計算 pandas 數據幀中選定列中值的唯一組合，包括值為 0 的頻率？

Question

在我的 dataframe（假設它稱為 df）中，我有兩列：一列標記為顏色，一列標記為 TOY_ID。 使用df.groupby(['Colour', 'TOY_ID']).size()我能夠生成第三列，該列未命名，表示其他兩列的值出現在我的df。 output 示例如下所示：

Colour            TOY_ID
Blue              31490.0       50
                  31569.0       50
                  50360636.0    20

                                ..
Yellow            50360636.0    25
                  50366678.0     9

                                ..
Green             31490.0       17
                  50366678.0    10

盡管此方法有效，但它沒有顯示前兩列值為 0 的組合。我知道這可以在 R 中完成，但我不確定如何在 Python 中做到這一點。 我想要的 output 的示例如下。 有什么建議么？

Colour            TOY_ID
Blue                 31490.0    50
                     31569.0    50
                  50360636.0    20
                  50366678.0     0
                                ..
Yellow               31490.0     0
                     31569.0     0
                  50360636.0    25
                  50366678.0     9
                                ..
Green                31490.0    17
                     31569.0     0
                  50360636.0     0
                  50366678.0    10

Answer 1

將Series.reindex與MultiIndex.from_product一起使用：

s = df.groupby(['Colour', 'TOY_ID']).size()


s = s.reindex(pd.MultiIndex.from_product(s.index.levels), fill_value=0)
print (s)
Colour  TOY_ID    
Blue    31490.0       50
        31569.0       50
        50360636.0    20
        50366678.0     0
Green   31490.0       17
        31569.0        0
        50360636.0     0
        50366678.0    10
Yellow  31490.0        0
        31569.0        0
        50360636.0    25
        50366678.0     9
Name: a, dtype: int64

如何計算 pandas 數據幀中選定列中值的唯一組合，包括值為 0 的頻率？

問題描述

1 個解決方案

解決方案1
1 已采納 2020-06-30 08:07:36

如何計算 pandas 數據幀中選定列中值的唯一組合，包括值為 0 的頻率？

問題描述

1 個解決方案

解決方案1 1 已采納 2020-06-30 08:07:36

解決方案1
1 已采納 2020-06-30 08:07:36