fillna 通過引用另一列但使用 pandas 復制相同的列值

Question

我有一個 dataframe 如下圖所示

df = pd.DataFrame(
    {'sub_code' : [np.nan, 'CSE01', np.nan, 
                   'CSE02', 'CSE03', 'CSE02',
                   'CSE03', 'CSE02'],
     'stud_level' : [101, 101, 101, 101, 
                  101, 101, 101, 101],
     'grade' : ['STA','STA','PSA','STA','STA','SSA','PSA','QSA']})

我想做以下

a) 通過參考grade列在sub_code列中填寫 NA。

b）例如：等級STA在row 1,3 and 4行具有相應的sub_code非 NA 值（ row 0 has NA value ）

c) 從grade列復制第一個非 NA ( CSE01 ) 值並將其放入sub_code列 ( row 0 )

我嘗試了以下

m = df['sub_code'].isna()
df.loc[m, 'sub_code'] = np.where(df.loc[m, 'grade'].ne(np.nan), df['sub_code'], 'not filled')

我希望我的 output 如下所示

Answer 1

groupby "grade" 並使用first獲取每個等級中的第一個非 NaN 子代碼。 然后使用np.where填充“sub_code”中的 NaN 值：

mapper = df.groupby('grade')['sub_code'].first()
df['sub_code'] = np.where(df['sub_code'].isna(), df['grade'].map(mapper), df['sub_code'])

或者代替第二行，您也可以使用fillna ：

df['sub_code'] = df.set_index('grade')['sub_code'].fillna(mapper)

Output：

  sub_code  stud_level grade
0    CSE01         101   STA
1    CSE01         101   STA
2    CSE03         101   PSA
3    CSE02         101   STA
4    CSE03         101   STA
5    CSE02         101   SSA
6    CSE03         101   PSA
7    CSE02         101   QSA

Answer 2

df['sub_code'] =df.groupby(['grade'])['sub_code'].bfill().ffill()



   sub_code  stud_level grade
0    CSE01         101   STA
1    CSE01         101   STA
2    CSE03         101   PSA
3    CSE02         101   STA
4    CSE03         101   STA
5    CSE02         101   SSA
6    CSE03         101   PSA
7    CSE02         101   QSA

fillna 通過引用另一列但使用 pandas 復制相同的列值

問題描述

2 個解決方案

解決方案1
1 2022-01-22 07:31:36

解決方案2
1 已采納 2022-01-22 07:33:45

fillna 通過引用另一列但使用 pandas 復制相同的列值

問題描述

2 個解決方案

解決方案1 1 2022-01-22 07:31:36

解決方案2 1 已采納 2022-01-22 07:33:45

解決方案1
1 2022-01-22 07:31:36

解決方案2
1 已采納 2022-01-22 07:33:45