[英]Pandas join on 2 columns
我在將這兩個df以我想要的方式加入時遇到了麻煩。 第一個df具有我使用df1 = df3.groupby(["STATE_PROV_CODE", "COUNTY"]).size()
創建的層次結構索引,以獲取每個縣的計數。
STATE_PROV_CODE COUNTY COUNT
AL Autauga County 1
Baldwin County 1
Barbour County 1
Bibb County 1
Blount County 1
STATE_PROV_CODE COUNTY ANSI Cl FIPS
0 AL Autauga County H1 01001
1 AL Baldwin County H1 01003
2 AL Barbour County H1 01005
3 AL Bibb County H1 01007
4 AL Blount County H1 01009
在SQL中,我想執行以下操作:
SELECT STATE_PROV_CODE, COUNTY, FIPS, COUNT,
FROM df1, df2
ON STATE_PROV_CODE, COUNTY
WHERE df1.STATE_PROV_CODE = df2.STATE_PROV_CODE
AND df1.COUNTY = df2.COUNTY
我希望結果如下:
STATE_PROV_CODE COUNTY COUNT FIPS
AL Autauga County 1 01001
Baldwin County 1 01003
Barbour County 1 01005
Bibb County 1 01007
Blount County 1 01009
我相信您設置groupby結果和第二個數據幀的方式,此合並調用將起作用:
df = pd.merge(df1, df2, left_index=True, right_on=['STATE_PROV_CODE', 'COUNTY'])
它將解開MultiIndex; 但是,如果您希望將其退回,那么您要做的就是
df = df.set_index(['STATE_PROV_CODE', 'COUNTY'])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.