[英]pandas: get unique rows based on their unordered multiple columns values
有DataFrame
In [1]: df = pd.DataFrame([[1,2],[2,3],[3,4],[2,1]], columns=['id_1', 'id_2'])
Out [1]:
id_1 id_2
0 1 2
1 2 3
2 3 4
3 2 1
如何選擇id_1=i
, id_2=j
行的最佳方法是什么?如何在df
中沒有id_1=j
和id_2=i
的行?
對於上面的示例,預期結果是
id_1 id_2
1 2 3
2 3 4
您可以首先按行對值進行排序,然后檢查重復項:
df[~df.apply(pd.np.sort, axis=1).duplicated(keep=False)]
# id_1 id_2
#1 2 3
#2 3 4
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.