Pandas：groupby 然后根据条件计数给出 NaN

Question

我有以下数据集：

+----+------+
| ID | Type |
+----+------+
| a  | New  |
+----+------+
| b  | Old  |
+----+------+
| b  | Old  |
+----+------+
| b  | New  |
+----+------+
| c  | Old  |
+----+------+

我正在尝试按 ID 分组，然后计算每个组的New出现次数。 因此，例如，我将有a=1 、 b=2和c=0 。

这是我尝试过的：

df['NewAmount'] = df.groupby('ID')['Type'].apply(
    lambda x: x[x == 'New'].count())

我明白了：

+----+------+----------+
| ID | Type | NewAmount|
+----+------+----------+
| a  | New  | NaN      |
+----+------+----------+
| b  | Old  | NaN      |
+----+------+----------+
| b  | Old  | NaN      |
+----+------+----------+
| b  | New  | NaN      |
+----+------+----------+
| c  | Old  | NaN      |
+----+------+----------+

Answer 1

您应该尝试使用transform

df['out'] = df['Type'].eq('New').groupby(df['ID']).transform('sum')

Pandas：groupby 然后根据条件计数给出 NaN

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-03-30 14:19:13

Pandas：groupby 然后根据条件计数给出 NaN

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-03-30 14:19:13

解决方案1
1 已采纳 2021-03-30 14:19:13