左合并两个数据框并仅填充 Pandas 中的 NaN 值

Question

对于数据帧df1和df2 ，我想根据date对它们进行合并以获得df ，如果v1或v2有值，则采用它们，否则采用df2的值。

df1

      date    v1    v2
0  2017-01  12.0   1.0
1  2017-02   2.0  13.0
2  2017-03  15.0   3.0
3  2017-04   NaN   NaN
4  2017-05   NaN   NaN

df2

      date  v1  v2  v3  v4
0  2017-01  13   9   7   7
1  2017-02   5   7   5  56
2  2017-03  15   8   6   9
3  2017-04  12  14   8   0
4  2017-05   8   8   4   6

刚试过，但我得到：

df = pd.merge(df1, df2, how = 'left', on = 'date')

输出：

      date  v1_x  v2_x  v1_y  v2_y  v3  v4
0  2017-01  12.0   1.0    13     9   7   7
1  2017-02   2.0  13.0     5     7   5  56
2  2017-03  15.0   3.0    15     8   6   9
3  2017-04   NaN   NaN    12    14   8   0
4  2017-05   NaN   NaN     8     8   4   6

如何获得所需的输出如下？ 谢谢。

      date  v1  v2  v3  v4
0  2017-01  12   1   7   7
1  2017-02   2  13   5  56
2  2017-03  15   3   6   9
3  2017-04  12  14   8   0
4  2017-05   8   8   4   6

请注意df1和df2 date存在重复值。

Answer 1

尝试使用fillna ：

print(df1.fillna(df2).join(df2[df2.columns.drop(df1.columns)]))

要不就：

print(df1.fillna(df2).join(df2[['v3', 'v4']]))

两个输出：

      date    v1    v2  v3  v4
0  2017-01  12.0   1.0   7   7
1  2017-02   2.0  13.0   5  56
2  2017-03  15.0   3.0   6   9
3  2017-04  12.0  14.0   8   0
4  2017-05   8.0   8.0   4   6

Answer 2

combine_first对我来说看起来很好，这是使用concat和groupby.first()的替代方法：

pd.concat((df1,df2),sort=False).groupby('date').first().reset_index()

      date    v1    v2   v3    v4
0  2017-01  12.0   1.0  7.0   7.0
1  2017-02   2.0  13.0  5.0  56.0
2  2017-03  15.0   3.0  6.0   9.0
3  2017-04  12.0  14.0  8.0   0.0
4  2017-05   8.0   8.0  4.0   6.0

Answer 3

如果您有其他解决方案，这似乎有效。 欢迎分享。

df1.set_index('date').combine_first(df2.set_index('date'))\
     .reindex(df1.date)\
     .reset_index()

输出：

      date    v1    v2   v3    v4
0  2017-01  12.0   1.0  7.0   7.0
1  2017-02   2.0  13.0  5.0  56.0
2  2017-03  15.0   3.0  6.0   9.0
3  2017-04  12.0  14.0  8.0   0.0
4  2017-05   8.0   8.0  4.0   6.0

左合并两个数据框并仅填充 Pandas 中的 NaN 值

问题描述

3 个解决方案

解决方案1
1 已采纳 2019-12-16 03:46:57

解决方案2
1 2019-12-16 03:52:49

解决方案3
0 2019-12-16 03:42:25

左合并两个数据框并仅填充 Pandas 中的 NaN 值

问题描述

3 个解决方案

解决方案1 1 已采纳 2019-12-16 03:46:57

解决方案2 1 2019-12-16 03:52:49

解决方案3 0 2019-12-16 03:42:25

解决方案1
1 已采纳 2019-12-16 03:46:57

解决方案2
1 2019-12-16 03:52:49

解决方案3
0 2019-12-16 03:42:25