使用條件 groupby 計算分類列的百分比並在 Pyhton 中計數

Question

我想為每個 id 計算來自 id 的所有行的 True 值的百分比。

這是我的數據示例：

id     col1    
 1     True
 1     True
 1     False
 1     True
 2     False
 2     False

新列應如下所示：

id     col1    num_true
 1     True     0.75
 1     True     0.75
 1     False    0.75
 1     True     0.75
 2     False    0
 2     False    0

這就是我試圖做的：

df['num_true']= df[df['col1'] == 'True'].groupby('id')['col1'].count()
df['num_col1_id']= df.groupby('id')['col1'].transform('count')

df['perc_true']= df.num_true/df.num_col1_id

Answer 1

groupby並應用transform來獲得mean

df['num_true']=df.groupby('id').col1.transform('mean')



  id   col1  num_true
0   1   True      0.75
1   1   True      0.75
2   1  False      0.75
3   1   True      0.75
4   2  False      0.00
5   2  False      0.00

Answer 2

這是詢問的代碼：

import pandas as pd
df = pd.DataFrame({"col1": [True,True,False,True,False,False]}, index = [1,1,1,1,2,2])
grouped_df = df.groupby(df.index)
df["num_true"] = grouped_df.sum() / grouped_df.count()

我在這里所做的是按索引對 dataframe 進行分組，然后，我將“真”值的數量相加，然后除以值的總數。

結果：

    col1    num_true
1   True    0.75
1   True    0.75
1   False   0.75
1   True    0.75
2   False   0.00
2   False   0.00

使用條件 groupby 計算分類列的百分比並在 Pyhton 中計數

問題描述

2 個解決方案

解決方案1
5 已采納 2020-08-13 12:14:35

解決方案2
2 2020-08-13 12:14:28

使用條件 groupby 計算分類列的百分比並在 Pyhton 中計數

問題描述

2 個解決方案

解決方案1 5 已采納 2020-08-13 12:14:35

解決方案2 2 2020-08-13 12:14:28

解決方案1
5 已采納 2020-08-13 12:14:35

解決方案2
2 2020-08-13 12:14:28