簡體   English   中英

如何刪除熊貓數據框中重復的行?

[英]How to remove rows with duplicates in pandas dataframe?

具有一個包含兩列( AB )中重復值的數據框:

A B
1 2
2 3
4 5
7 6
5 8

我想刪除重復項,以便僅保留唯一值:

A B
1 2
4 5
7 6

此命令不提供我想要的:

df.drop_duplicates(subset=['A','B'], keep='first')

任何想法如何做到這一點?

您可以將stackunstack一起使用:

print (df.stack().drop_duplicates().unstack().dropna().astype(int))
   A  B
0  1  2
2  4  5
3  7  6

boolean indexing解決方案:

print (df[~df.stack().duplicated().unstack().any(1)])
   A  B
0  1  2
2  4  5
3  7  6

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM