pandas中的就地更新：根据条件更新单元格的值

Question

      DOB        Name      
0   1956-10-30   Anna
1   1993-03-21   Jerry        
2   2001-09-09   Peter     
3   1993-01-15   Anna   
4   1999-05-02   James 
5   1962-12-17   Jerry
6   1972-05-04   Kate

在类似于上面我有重复名称的数据框中。 因此，如果 DOB 早于 1990 年且名称重复，我想在名称中添加后缀“_0”。

我期待这样的结果

      DOB        Name      
0   1956-10-30   Anna_0
1   1993-03-21   Jerry        
2   2001-09-09   Peter     
3   1993-01-15   Anna   
4   1999-05-02   James
5   1962-12-17   Jerry_0
6   1972-05-04   Kate

我正在使用以下

df['Name'] = df[(df['DOB'] < '01-01-1990') & (df['Name'].isin(['Anna','Jerry']))].Name.apply(lambda x: x+'_0')

但我得到了这个结果

      DOB        Name      
0   1956-10-30   Anna_0
1   1993-03-21   NaN
2   2001-09-09   NaN     
3   1993-01-15   NaN   
4   1999-05-02   NaN
5   1962-12-17   Jerry_0
6   1972-05-04   NaN

如何为重复的姓名添加后缀，并且必须在 1990 年之前出生。

Answer 1

你的问题df['Name'] = df[(df['DOB'] < '01-01-1990') & (df['Name'].isin(['Anna','Jerry']))].Name.apply(lambda x: x+'_0')是df[(df['DOB'] < '01-01-1990') & (df['Name'].isin(['Anna','Jerry']))]是一个过滤的数据帧，其行数少于原始数据帧。 当您将其分配回来时，未过滤的行在过滤的数据框中没有相应的值，因此它变为NaN 。

你可以试试mask

m = (df['DOB'] < '1990-01-01') & df['Name'].duplicated(keep=False)

df['Name'] = df['Name'].mask(m, df['Name']+'_0')

Answer 2

您可以使用掩码和布尔索引：

# is the year before 1990?
m1 = pd.to_datetime(df['DOB']).dt.year.lt(1990)
# is the name duplicated?
m2 = df['Name'].duplicated(keep=False)

# if both conditions are True, add '_0' to the name
df.loc[m1&m2, 'Name'] += '_0'

输出：

          DOB     Name
0  1956-10-30   Anna_0
1  1993-03-21    Jerry
2  2001-09-09    Peter
3  1993-01-15     Anna
4  1999-05-02    James
5  1962-12-17  Jerry_0
6  1972-05-04     Kate

pandas中的就地更新：根据条件更新单元格的值

问题描述

2 个解决方案

解决方案1
1 2022-07-05 12:17:59

解决方案2
0 已采纳 2022-07-05 12:06:20

pandas中的就地更新：根据条件更新单元格的值

问题描述

2 个解决方案

解决方案1 1 2022-07-05 12:17:59

解决方案2 0 已采纳 2022-07-05 12:06:20

解决方案1
1 2022-07-05 12:17:59

解决方案2
0 已采纳 2022-07-05 12:06:20