Pandas Dataframe替換系列中的值

Question

我正在嘗試根據條件選擇更新my_df，如：

my_df[my_df['group'] == 'A']['rank'].fillna('A+')

但是，這不是持久性...例如：my_df仍然有NaN或NaT ......我不知道如何在in_place中執行此操作。 請告知如何將更新保留到my_df。

Answer 1

創建布爾掩碼並分配給篩選的列rank ：

my_df = pd.DataFrame({'group':list('AAAABC'),
                     'rank':['a','b',np.nan, np.nan, 'c',np.nan],
                     'C':[7,8,9,4,2,3]})

print (my_df)
  group rank  C
0     A    a  7
1     A    b  8
2     A  NaN  9
3     A  NaN  4
4     B    c  2
5     C  NaN  3

m = my_df['group'] == 'A'
my_df.loc[m, 'rank'] = my_df.loc[m, 'rank'].fillna('A+')

print(my_df)
  group rank  C
0     A    a  7
1     A    b  8
2     A   A+  9
3     A   A+  4
4     B    c  2
5     C  NaN  3

Answer 2

您需要將其分配回來

my_df.loc[my_df['group'] == 'A','rank']=my_df.loc[my_df['group'] == 'A','rank'].fillna('A+')

Answer 3

您的操作不在原地，因此您需要分配回變量。 此外，不建議使用鏈式索引。

一個選項是帶有布爾系列的pd.Series.mask ：

# data from @jezrael

df['rank'].mask((df['group'] == 'A') & df['rank'].isnull(), 'A+', inplace=True)

print(df)

   C group rank
0  7     A    a
1  8     A    b
2  9     A   A+
3  4     A   A+
4  2     B    c
5  3     C  NaN

Pandas Dataframe替換系列中的值

問題描述

3 個解決方案

解決方案1
2 已采納 2018-08-15 14:26:02

解決方案2
2 2018-08-15 14:26:17

解決方案3
1 2018-08-15 16:09:50

Pandas Dataframe替換系列中的值

問題描述

3 個解決方案

解決方案1 2 已采納 2018-08-15 14:26:02

解決方案2 2 2018-08-15 14:26:17

解決方案3 1 2018-08-15 16:09:50

解決方案1
2 已采納 2018-08-15 14:26:02

解決方案2
2 2018-08-15 14:26:17

解決方案3
1 2018-08-15 16:09:50