使用apply（）合並熊貓DataFrame以僅在兩列的部分匹配中進行合並

Question

我需要合並兩個pandas DataFrame，但不僅要合並確切的列值，還要合並近似的值。

例如，我有以下兩個DataFrame：

import pandas as pd
d = {'col1': ["a", "b", "c", "d"], 'col2': [3, 4, 66, 120]}
df = pd.DataFrame(data=d)

    col1    col2
0   a       3
1   b       4
2   c       66
3   d       120

d2 = {'col1a': ["aa", "bb", "cc", "dd"], 'col2b': [3, 4, 67, 100]}
df2 = pd.DataFrame(data=d2)
    col1a   col2b
0   aa      3
1   bb      4
2   cc      67
3   dd      100

現在，如果我只是將它們連接到col2和col2b列上，那么我將僅獲得兩列值完全相同的行。

pd.merge(df, df2, how='inner', left_on='col2', right_on='col2b')
    col1    col2    col1a   col2b
0   a       3       aa      3
1   b       4       bb      4

現在，為簡單起見，我還想基於來自左側DataFrame的整數值的+1或-1的整數合並列值。 在我們的示例中，除了具有值3和4的行之外，左側的DataFrame中的值66還應與右側的DataFrame中的值67匹配：

        col1    col2    col1a   col2b
    0   a       3       aa      3
    1   b       4       bb      4
    2   c       66      cc      67

不確定如何解決此問題，是否需要使用apply()基於近似的列值進行合並？

Answer 1

這是來自merge_asof一種方法

pd.merge_asof(df,df2,left_on='col2',right_on='col2b',tolerance = 1,direction ='nearest').dropna()
Out[7]: 
  col1  col2 col1a  col2b
0    a     3    aa    3.0
1    b     4    bb    4.0
2    c    66    cc   67.0

使用apply（）合並熊貓DataFrame以僅在兩列的部分匹配中進行合並

問題描述

1 個解決方案

解決方案1
5 已采納 2019-04-23 13:53:44

使用apply（）合並熊貓DataFrame以僅在兩列的部分匹配中進行合並

問題描述

1 個解決方案

解決方案1 5 已采納 2019-04-23 13:53:44

解決方案1
5 已采納 2019-04-23 13:53:44