如何刪除熊貓數據框中重復的行？

Question

具有一個包含兩列（ A和B ）中重復值的數據框：

我想刪除重復項，以便僅保留唯一值：

此命令不提供我想要的：

df.drop_duplicates(subset=['A','B'], keep='first')

任何想法如何做到這一點？

Answer 1

您可以將stack與unstack一起使用：

print (df.stack().drop_duplicates().unstack().dropna().astype(int))
   A  B
0  1  2
2  4  5
3  7  6

boolean indexing解決方案：

print (df[~df.stack().duplicated().unstack().any(1)])
   A  B
0  1  2
2  4  5
3  7  6