从第二列替换列中的 NaN 值

Question

我想用相应的Node值替换Target中的NaN值。 我的数据是：

 Node  Target   Color
node1   node7   Red
node1   node9   Red
node3   node5   Green
node1   node3   Red
node3   node1   Red
node5   NaN     Yellow

我需要：

   Node  Target     Color
    node1   node7   Red
    node1   node9   Red
    node3   node5   Green
    node1   node3   Red
    node3   node1   Red
    node5   node5   Yellow # here the replacement

我认为一个可能的解决方案可能是使用 if 语句来检查节点的Target是否等于 NaN：如果是，则可以将自己分配为目标。

Answer 1

是的， df.fillna(value, ...)将允许value (replacement) arg 成为 Series (column) ，而不仅仅是一个常量：

df['Target'] = df['Target'].fillna(df['Node'])

请注意，这比 if...else 逻辑要好，因为它对整个 dataframe 进行了一个矢量化分配，如下面的测试用例所示。

或者，如果df.fillna()不允许我们这样做：

您还可以在您感兴趣的列上使用df.where() ，其中df.where(... other) arg 是您的替换列df['Node'] ：

df['Target'] = df['Target'].where(df['Target'].notna(), df['Node'])

还要注意我们如何使用逻辑索引，使用df['Target'].notna()来获取目标为/不是 NA 的行的掩码/逻辑向量。

更好的测试用例：

import pandas as pd
from io import StringIO

df = """ Node  Target   Color
node1   node7   Red
node1   node9   Red
node2   NaN     Brown
node3   node5   Green
node1   node3   Red
node3   node1   Red
node5   NaN     Yellow"""

df = pd.read_csv(StringIO(df), sep=r'\s+')

从第二列替换列中的 NaN 值

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-04-09 21:04:26

从第二列替换列中的 NaN 值

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-04-09 21:04:26

解决方案1
1 已采纳 2021-04-09 21:04:26