根据熊猫数据框中的特定 id 更改列的值

Question

我有以下排序的数据框，我想将id 列中每个id的最后一个值设置为0

我可以使用df['value'].iloc[-1] = 0将整个id 列的最后一个值设置为df['value'].iloc[-1] = 0 。 如何设置id : 1和id : 2的最后一个值以获得以下输出。

Answer 1

您可以执行drop_duplicates并保留 last 以获取每个 id 的最后一行。 使用这些行的index并将值设置为 0

df.loc[df['id'].drop_duplicates(keep='last').index, 'value'] = 0

print(df)
   id  value
0   1    500
1   1     50
2   1      0
3   2     45
4   2    150
5   2     70
6   2     20
7   2      0

Answer 2

 df.loc[~df.id.duplicated('last'),'value']=0

崩溃了

    m=df.id.duplicated('last')
    
    df.loc[~m,'value']=0




id  value
0   1    500
1   1     50
2   1      0
3   2     45
4   2    150
5   2     70
6   2     20
7   2      0

这个怎么运作

m=df.id.duplicated('last')# Selects the last duplicated in column id

~m reverses that and hence last duplicated becomes true

df.loc[~m,'value']# loc accessor allows us to reach the True value in the nominated column to write with 0

Answer 3

如果您愿意使用numpy这里是一个快速的解决方案：

import numpy as np

# Recreate example
df = pd.DataFrame({
    "id":[1,1,1,2,2,2,2,2],
    "value": [500,50,36,45,150,70,20,10]
})
# Solution
df["value"] = np.where(~df.id.duplicated(keep="last"),0,df["value"].to_numpy())

根据熊猫数据框中的特定 id 更改列的值

问题描述

3 个解决方案

解决方案1
5 已采纳 2020-08-25 21:01:00

解决方案2
4 2020-08-25 21:04:41

解决方案3
1 2020-08-25 21:30:09

根据熊猫数据框中的特定 id 更改列的值

问题描述

3 个解决方案

解决方案1 5 已采纳 2020-08-25 21:01:00

解决方案2 4 2020-08-25 21:04:41

解决方案3 1 2020-08-25 21:30:09

解决方案1
5 已采纳 2020-08-25 21:01:00

解决方案2
4 2020-08-25 21:04:41

解决方案3
1 2020-08-25 21:30:09