[英]Pandas merge tables with two columns in common
我正在研究兩個大數據庫:
我想通過County和State和Year join
兩個數據框,但是 dataM 必須保留所有列,並且只獲得 dataD 的剝奪指數百分比。 另外,我想drop
一個或另一個上不存在縣的行。 例如,在 dataM 上我們有 AK 及其縣,但在 dataD 上沒有 AK,所以我想drop
dataM 上的所有這些行。 同樣,如果縣和州都存在,我想將剝奪指數百分比分配給 state 中該縣的所有行。 我嘗試了everyting,買了我不能讓它工作。
我在許多 forms 中都試過這個:
dataM = pd.merge(dataM, dataD, how='right', left_on=['County', 'State'], right_on=['County', 'State'])
通過過濾兩個數據幀上的鮑德溫縣,我得到了這個:
如果縣和 state 存在於兩個數據框中,我不明白為什么我會得到 NaN。 請幫我。
我認為你需要一個內部連接 -
dataM = pd.merge(dataM, dataD[['depr_ind_col', 'County', 'State']], how='inner', left_on=['County', 'State'], right_on=['County', 'State'])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.