簡體   English   中英

從數據框中刪除重復項

[英]remove duplicates from dataframe

我有一個數據框“ df”,如下面的示例。 我想使用address和business_id作為唯一鍵,並過濾數據框,使其僅具有基於address和business_id組合的唯一記錄。 誰能建議該怎么做?

碼:

print df[["address","business_id","city"]][1:3]

樣本數據:

               address             business_id       city
1       2824 Milton Rd  mLwM-h2YhXl2NCgdS84_Bw  Charlotte
2  337 Danforth Avenue  v2WhjAB3PIBA8J8VxG3wEg    Toronto

除了刪除重復項外,您還想使用df.set_index

df.set_index(keys=["address","business_id"])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM