簡體   English   中英

使用內連接結合 2 dataframe 並僅在 Python 中進行最后一次觀察

[英]Combining 2 dataframe using Inner join and taking last observation only in Python

我有 2 個數據框,我想將它們加入 2 列,如果該內部連接存在超過 1 條記錄,則僅獲取記錄

DF1
在此處輸入圖像描述

DF2
在此處輸入圖像描述

當我在“Patient_id”和“diag_date”上使用內連接結合 Dataframe 時,我得到

在此處輸入圖像描述

我只想要 DF1 的 idx '934814' -> Nasal Steroids to map 對抗 DF2 的 '42775',而不想要任何其他我不想按患者 ID 分組的索引,並獲取最后一條記錄。在合並 2 個表時需要它. 我只想要內部連接中的最后一行,而不是全部應用。 各位大佬能不能給點解決辦法啊!

非常感謝!

DataFrame.merge之前使用DataFrame.drop_duplicateskeep='last'和用於連接的列:

df = (DF1.drop_duplicates(['Patient_id','Prescription_date'], keep='last')
         .merge(DF2, on=['Patient_id','Prescription_date']))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM