根据 Date 列将 df1 中的列添加到 df2 中，如果缺少 df1 [Date] 条目，则填写 na

Question

我有df1具有 850 行和列名['Date', 'A']数据框。 我也有df2 900 行和列名['Date', 'B', 'C', 'D'] 。

它们的行数不同是因为df1缺少一些“日期”条目。 但是，df1['Date'] 中的所有条目都在 df2['Date'] 中。

问题：我想基于相同的['Date']行将df1['A']合并到df2 。 合并后，我希望生成的df2['A']为df1中缺少['Dates']的所有行反映一个 'na' 。

我尝试df2=pd.merge(df2, df1, on="Date")但我得到的结果df2有 850 行，这似乎是删除了 df1 和 df2 之间不匹配的日期。 相反，我希望合并后的结果df2为 900 行，并且不匹配的日期行应在 df2['A']` 中显示“na”。

如何做到这一点？

Answer 1

使用left连接而不是inner连接（默认行为）

IE，

new_df = pd.merge(df2, df1, on="Date", how='left')

用零填充NA （如 OP 在评论中要求的那样），

new_df.fillna(0, inplace=True)
# new_df['column'] = new_df['column'].astype(np.float64) # to convert column to float