在 pandas 中满足条件后按组前向填充缺失值

Question

我对此有点麻烦。 我的 dataframe 看起来像这样：

id    amount    dummy
1      130        0
1      120        0
1      110        1
1      nan       nan 
1      nan       nan   
2      nan        0
2      50         0
2      20         1
2      nan       nan 
2      nan       nan

所以，我需要做的是，在 dummy 获得 value = 1 之后，我需要为每个id填充 amount 变量为零，如下所示：

id    amount    dummy
1      130        0
1      120        0
1      110        1
1       0        nan 
1       0        nan   
2      nan        0
2      50         0
2      20         1
2       0        nan 
2       0        nan

我猜我需要groupby('id') ， fillna(method='ffill') ，也许是.loc或shift()的某种组合，但我尝试的一切都有一些问题或非常慢。 有什么建议么？

Answer 1

我将使用的方式

s = df.groupby('id')['dummy'].ffill().eq(1)
df.loc[s&df.dummy.isna(),'amount']=0

Answer 2

你可以更容易地做到这一点：

data[data['dummy'].isna()]['amount'] = 0

这将 select 所有 dummy 为 nan 的行并用 0 填充金额列。

Answer 3

IIUC、 ffill()和掩码 Still-nan：

s = df.groupby('id')['amount'].ffill().notnull()
df.loc[df['amount'].isna() & s, 'amount'] = 0

Output：

   id  amount  dummy
0   1   130.0    0.0
1   1   120.0    0.0
2   1   110.0    1.0
3   1     0.0    NaN
4   1     0.0    NaN
5   2     NaN    0.0
6   2    50.0    0.0
7   2    20.0    1.0
8   2     0.0    NaN
9   2     0.0    NaN

Answer 4

请您尝试以下操作。

df.loc[df['dummy'].isnull(),'amount']=0
df

Output 如下。

    id  amount  dummy
0   1   130.0   0.0
1   1   120.0   0.0
2   1   110.0   1.0
3   1   0.0     NaN
4   1   0.0     NaN
5   2   NaN     0.0
6   2   50.0    0.0
7   2   20.0    1.0
8   2   0.0     NaN
9   2   0.0     NaN

在 pandas 中满足条件后按组前向填充缺失值

问题描述

4 个解决方案

解决方案1
6 已采纳 2019-10-04 14:02:05

解决方案2
2 2019-10-04 13:50:47

解决方案3
1 2019-10-04 13:48:07

解决方案4
1 2019-10-06 08:52:43

在 pandas 中满足条件后按组前向填充缺失值

问题描述

4 个解决方案

解决方案1 6 已采纳 2019-10-04 14:02:05

解决方案2 2 2019-10-04 13:50:47

解决方案3 1 2019-10-04 13:48:07

解决方案4 1 2019-10-06 08:52:43

解决方案1
6 已采纳 2019-10-04 14:02:05

解决方案2
2 2019-10-04 13:50:47

解决方案3
1 2019-10-04 13:48:07

解决方案4
1 2019-10-06 08:52:43