Python Pandas 將一列中的 NaN 替換為與列表列相同行的另一列中的值

Question

輸入數據框

data = {

'id' :[70,70,1148,557,557,104,581,69],
'r_id' : [[70,34, 44, 23, 11, 71], [70, 53, 33, 73, 41], 
          np.nan, np.nan, np.nan, np.nan,np.nan,[69, 68, 7],]
}

df = pd.DataFrame.from_dict(data)
print (df)
     id                      r_id
0    70  [70, 34, 44, 23, 11, 71]
1    70      [70, 53, 33, 73, 41]
2  1148                       NaN
3   557                       NaN
4   557                       NaN
5   104                       NaN
6   581                       NaN
7    69               [69, 68, 7]

輸出數據幀，

data = {

'id' :[70,70,1148,557,557,104,581,69],
'r_id' : [[70,34, 44, 23, 11, 71], [70, 53, 33, 73, 41], 
          [1148], [557], [557], [104],[581],[69, 68, 7]]
}

df = pd.DataFrame.from_dict(data)
print (df)
     id                      r_id
0    70  [70, 34, 44, 23, 11, 71]
1    70      [70, 53, 33, 73, 41]
2  1148                    [1148]
3   557                     [557]
4   557                     [557]
5   104                     [104]
6   581                     [581]
7    69               [69, 68, 7]

我想要帶有列表列的目標列 r_id 源列 id 不是列表，請參考 stackoverflow 中的以下鏈接， python-pandas-replace-nan-in-one-column 也嘗試了以下操作，data_merge_rel.RELATED_DEVICE.fillna (data_merge_rel.DF0_Desc_Label_i.to_list(), inplace=True)

Answer 1

您可以使用explode()和groupby() ：

(df.explode('r_id').ffill(axis=1).reset_index().groupby(['index','id'],sort=False).agg(list)
                                                               .reset_index(1))

         id                      r_id
index                                
0        70  [70, 34, 44, 23, 11, 71]
1        70      [70, 53, 33, 73, 41]
2      1148                    [1148]
3       557                     [557]
4       557                     [557]
5       104                     [104]
6       581                     [581]
7        69               [69, 68, 7]

Answer 2

我們可以使用list_comprehension + Series.fillna 。

首先，我們創建一個列表，其中所有id值都轉換為list類型。 然后我們在這里用我們的列表值替換NaN ：

df['temp'] = [[x] for x in df['id']]
df['r_id'] = df['r_id'].fillna(df['temp'])
df = df.drop(columns='temp')

或者在一行中使用apply （感謝r.ook ）

df['r_id'] = df['r_id'].fillna(df['id'].apply(lambda x: [x]))

     id                      r_id
0    70  [70, 34, 44, 23, 11, 71]
1    70      [70, 53, 33, 73, 41]
2  1148                    [1148]
3   557                     [557]
4   557                     [557]
5   104                     [104]
6   581                     [581]
7    69               [69, 68, 7]

Answer 3

您可以將列 id 轉換為一個數組，添加一個維度，然后創建一個列表並使用 Series fillna ，例如：

df['r_id'] = df['r_id'].fillna(pd.Series(df.id.to_numpy()[:,None].tolist(), index=df.index))
print (df)
     id                      r_id
0    70  [70, 34, 44, 23, 11, 71]
1    70      [70, 53, 33, 73, 41]
2  1148                    [1148]
3   557                     [557]
4   557                     [557]
5   104                     [104]
6   581                     [581]
7    69               [69, 68, 7]

或者如果你沒有很多nan ，在做任何事情之前只選擇這些行可能是值得的：

mask_na = df.r_id.isna()
df.loc[mask_na, 'r_id'] = pd.Series(df.loc[mask_na,'id'].to_numpy()[:,None].tolist(), 
                                    index=df[mask_na].index)

Answer 4

我認為 anky_91 的回答會更快，但你也可以試試這個：

df['r_id'] = np.where(df['r_id'].isnull(),
                      df['id'].apply(lambda x: [x]),
                      df['r_id'])

輸出：

     id                      r_id
0    70  [70, 34, 44, 23, 11, 71]
1    70      [70, 53, 33, 73, 41]
2  1148                    [1148]
3   557                     [557]
4   557                     [557]
5   104                     [104]
6   581                     [581]
7    69               [69, 68, 7]

Python Pandas 將一列中的 NaN 替換為與列表列相同行的另一列中的值

問題描述

4 個解決方案

解決方案1
2 2019-12-18 17:38:56

解決方案2
2 已采納 2019-12-18 17:57:34

解決方案3
1 2019-12-18 17:52:45

解決方案4
1 2019-12-18 17:54:37

Python Pandas 將一列中的 NaN 替換為與列表列相同行的另一列中的值

問題描述

4 個解決方案

解決方案1 2 2019-12-18 17:38:56

解決方案2 2 已采納 2019-12-18 17:57:34

解決方案3 1 2019-12-18 17:52:45

解決方案4 1 2019-12-18 17:54:37

解決方案1
2 2019-12-18 17:38:56

解決方案2
2 已采納 2019-12-18 17:57:34

解決方案3
1 2019-12-18 17:52:45

解決方案4
1 2019-12-18 17:54:37