我有兩個數據框（DF1）和（DF2）。我想替換 (DF2) 中與 (DF1) 的兩列上的條件匹配的列的值

Question

我想用 DataFrame2 (DF2) 中的相應“Salary”填充 DataFrame1 (DF1) 中的“Salary”列。 這些需要匹配“團隊”和“球員”。

要注意：

數據框是：大小不同。 不是同一個順序。

import pandas as pd


#df 1:

nba_data = {'Team': ['Mavericks', 'Mavericks', 'Mavericks', '', 'NewYorkKnicks17','Houston Rockets', 'NewYorkKnicks17'], 
            'Players': ['Luka Doncic', 'Kristaps Porzingis', 'Jalen Brunson', 'Kristaps Porzingis', 'JR Smith',
                        'James Harden', 'Derrick Rose',],
            'Salary': ['0', '0', '0','0', '0', '0', '0'],
           'Coach': ['Rick Carlisle', 'Rick Carlisle', 'Steve Kerr', 'Phil Jackson', 'Tom Thibideou', '', '']}

nba_df1 = pd.DataFrame(nba_data)

nba_df1


#df2:

nba_data2 = {'Team': ['Mavericks', 'Mavericks', 'Mavericks', 'NewYorkKnicks17', 'NewYorkKnicks17', 'NewYorkKnicks17', 'Houston Rockets'], 
            'Players': ['Luka Doncic', 'Kristaps Porzingis', 'Steph Curry', 'JR Smith', 'Derrick Rose',
                        'Kristaps Porzingis', 'James Harden'],
            'Salary': ['3m', '126m', '0','115m', '0', '20m', '1.5m'],
            'Coach': ['Rick Carlisle', 'Rick Carlisle', 'Steve Kerr', '', 'Tom Thibideou', 'Phil Jackson', '']}


nba_df2 = pd.DataFrame(nba_data2)

nba_df2

所需的結果 = nba_df1 並填充了適當的薪水（運行以下命令）：

nba_data3 = {'Team': ['Mavericks', 'Mavericks', 'Mavericks', '', 'NewYorkKnicks17','Houston Rockets', 'NewYorkKnicks17'], 
            'Players': ['Luka Doncic', 'Kristaps Porzingis', 'Jalen Brunson', 'Kristaps Porzingis', 'JR Smith',
                        'James Harden', 'Derrick Rose',],
            'Salary': ['3m', '126m', '0','20m', '115m', '1.5m', '0'],
           'Coach': ['Rick Carlisle', 'Rick Carlisle', 'Steve Kerr', 'Phil Jackson', 'Tom Thibideou', '', '']}



nba_df1_adjusted = pd.DataFrame(nba_data3)






Kindly note: this is not a tutorial. - it is a specific question and therefore not a duplicate of a general tutorial.

Answer 1

agg = pd.merge(nba_df1, nba_df2, on = ['Players', 'Team'], how = 'left')

您的結果將在 Salary_y 上

編輯：有點臟，但它有效：

agg = pd.merge(nba_df1, nba_df2[['Team', 'Players', 'Salary']], on = ['Players', 'Team'], how = 'left')
agg2 = pd.merge(nba_df1, nba_df2, on = ['Players', 'Coach'], how = 'left')

merge = pd.merge(agg, agg2, on = ['Players', 'Coach'])

merge['Salary'] = merge['Salary_y_x'].fillna(merge['Salary_y_y'])

我有兩個數據框（DF1）和（DF2）。我想替換 (DF2) 中與 (DF1) 的兩列上的條件匹配的列的值

問題描述

1 個解決方案

解決方案1
2 2019-10-31 15:37:06

我有兩個數據框（DF1）和（DF2）。 我想替換 (DF2) 中與 (DF1) 的兩列上的條件匹配的列的值

問題描述

1 個解決方案

解決方案1 2 2019-10-31 15:37:06

我有兩個數據框（DF1）和（DF2）。我想替換 (DF2) 中與 (DF1) 的兩列上的條件匹配的列的值

解決方案1
2 2019-10-31 15:37:06