簡體   English   中英

Python Pandas-如何在具有不同級別數的索引上聯接DataFrame?

[英]Python Pandas - How do I join DataFrames on indices with different number of levels?

假設我有以下兩個DataFrame:

  1. df1,其索引為['NameID','Date']。 例如,df1可以是公司員工歷史工資的面板數據集。

  2. df2,其索引為['NameID']。 例如,df2可以是員工生日和SSN的數據集。

在“ NameID”上以1:m為基礎將df1和df2作為索引連接的最有效方法是什么? DataFrame.join()不允許1:m連接。 我知道我可以先對df1和df2進行reset_index(),然后使用DataFrame.merge()將它們連接到列上,但是我認為這樣做效率不高。

碼:

df1 = pd.DataFrame({'NameID':['A','B','C']*3,
                    'Date':['20180801']*3+['20180802']*3+['20180803']*3,
                    'Salary':np.random.rand(9)
               })
df1 = df1.set_index(['NameID', 'Date'])
df1

NameID  Date    Salary
A   20180801    0.831064
B   20180801    0.419464
C   20180801    0.239779
A   20180802    0.500048
B   20180802    0.317452
C   20180802    0.188051
A   20180803    0.076196
B   20180803    0.060435
C   20180803    0.297118

df2 = pd.DataFrame({'NameID':['A','B','C'],                   
                    'SSN':[999,888,777]
                   })
df2 = df2.set_index(['NameID'])
df2

NameID  SSN
A       999
B       888
C       777

我想要得到的結果是:

NameID  Date        Salary      SSN
A       20180801    0.831064    999
A       20180802    0.500048    999
A       20180803    0.076196    999
B       20180801    0.419464    888
B       20180802    0.317452    888
B       20180803    0.060435    888
C       20180801    0.239779    777
C       20180802    0.188051    777
C       20180803    0.297118    777

您可能要合並

df = pd.merge(df1, df2, on='NameID', how='left')

請參閱Michael B的答案,但除此之外,您可能還希望進行排序以獲得所需的輸出:

pd.merge(df1, df2, on='NameID', how='left').sort_values('SSN', ascending=False)

代表warwick12回答

df3 = pd.merge(df1,df2,left_index = True,right_index = True)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM