与熊猫合并两个不同的数据框

Question

我是熊猫新手，我需要完成以下任务，有没有有效的方法来做？ 有2个不同的数据帧dfa和dfb：

我用它来将它们合并在一起：

df = pd.merge(dfa, dfb, left_on = ['a_retry','a_cca', 'a_rssif', 'a_lqif'], right_on = ['b_retry','b_cca', 'b_rssif', 'b_lqif'])

我得到了df输出：

但是，这不是我的期望。 合并的数据帧包含所有列，可以，但是行不得超过较小的行（也称为dfa），这意味着必须删除第3行，预期的是： 我怎样才能做到这一点？ 谢谢。

Answer 1

可以预期，因为每4列都有重复项。

因此需要通过drop_duplicates删除重复的行：

dfa = dfa.drop_duplicates(subset=['a_retry','a_cca', 'a_rssif', 'a_lqif'])
dfb = dfb.drop_duplicates(subset=['b_retry','b_cca', 'b_rssif', 'b_lqif'])

但是，如果需要匹配重复行，是否可以使用cumcount new column进行merge ：

dfa['new'] = dfa.groupby(['a_retry','a_cca', 'a_rssif', 'a_lqif']).cumcount()
dfb['new'] = dfb.groupby(['b_retry','b_cca', 'b_rssif', 'b_lqif']).cumcount()

df = (pd.merge(dfa, 
               dfb, 
               left_on = ['a_retry','a_cca', 'a_rssif', 'a_lqif', 'new'], 
               right_on = ['b_retry','b_cca', 'b_rssif','b_lqif', 'new']).drop('new', axis=1))

与熊猫合并两个不同的数据框

问题描述

1 个解决方案

解决方案1
0 2018-05-23 14:57:44

与熊猫合并两个不同的数据框

问题描述

1 个解决方案

解决方案1 0 2018-05-23 14:57:44

解决方案1
0 2018-05-23 14:57:44