[英]How to remove rows with duplicates in pandas dataframe?
具有一個包含兩列( A
和B
)中重復值的數據框:
A B
1 2
2 3
4 5
7 6
5 8
我想刪除重復項,以便僅保留唯一值:
A B
1 2
4 5
7 6
此命令不提供我想要的:
df.drop_duplicates(subset=['A','B'], keep='first')
任何想法如何做到這一點?
print (df.stack().drop_duplicates().unstack().dropna().astype(int))
A B
0 1 2
2 4 5
3 7 6
boolean indexing
解決方案:
print (df[~df.stack().duplicated().unstack().any(1)])
A B
0 1 2
2 4 5
3 7 6
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.