比较两个熊猫数据框列的元素，并基于第三列创建一个新列

Question

我有两个数据框：

df1:

| ID | PersonID | Sex |
|:--:|:--------:|:---:|
|  1 |    123   |  M  |
|  2 |    124   |  F  |
|  3 |    125   |  F  |
|  4 |    126   |  F  |
|  5 |    127   |  M  |
|  6 |    128   |  M  |
|  7 |    129   |  F  |

df2:
| ID | PersonID | Infected |
|:--:|:--------:|:--------:|
|  1 |    125   |   True   |
|  2 |    124   |   False  |
|  3 |    126   |   False  |
|  4 |    128   |   True   |

我想比较这两个数据框中的人员ID，如果不匹配人员ID，则将相应的Infected值插入df1和False中。 理想情况下，输出如下所示：

df1:
| ID | PersonID | Sex | Infected |
|:--:|:--------:|:---:|:--------:|
|  1 |    123   |  M  |   False  |
|  2 |    124   |  F  |   False  |
|  3 |    125   |  F  |   True   |
|  4 |    126   |  F  |   False  |
|  5 |    127   |  M  |   False  |
|  6 |    128   |  M  |   True   |
|  7 |    129   |  F  |   False  |

我有一个for循环编码，它花费的时间太长，而且可读性不强。 有一种有效的方法可以做到这一点吗？ 谢谢！

Answer 1

一种方法是为df1['PersonID'].map()提供一个Series，该Series的索引为PersonID并且值被Infected ：

df1['Infected'] = df1['PersonID'].map(df2.set_index('PersonID')['Infected']).fillna(False)

Answer 2

另一种方法是使用pd.merge

df1 = pd.merge(df1, df2[['PersonID', 'Infected']], on=['PersonID'], how='left').fillna(False)

要么

df1 = df1.merge(df2[['PersonID', 'Infected']], on=['PersonID'], how='left').fillna(False)

比较两个熊猫数据框列的元素，并基于第三列创建一个新列

问题描述

2 个解决方案

解决方案1
1 已采纳 2019-03-14 03:01:50

解决方案2
0 2019-03-14 06:36:35

比较两个熊猫数据框列的元素，并基于第三列创建一个新列

问题描述

2 个解决方案

解决方案1 1 已采纳 2019-03-14 03:01:50

解决方案2 0 2019-03-14 06:36:35

解决方案1
1 已采纳 2019-03-14 03:01:50

解决方案2
0 2019-03-14 06:36:35