如何在兩列之間刪除重復項，但在各列中保留唯一值？

Question

我有一個看起來像這樣的df；

col1     col2  
aa       aa
cc       bb
dd       dd

如何比較同一df中的兩列，但刪除重復項並在各自的列中保持唯一性？

新df：

col1     col2  
cc       bb

Answer 1

我們可以構造一個過濾器來檢查df.col1的值是否不同於df.col2 ，然后進行過濾，例如：

df[df.col1 != df.col2]

例如：

>>> df = pd.DataFrame([['aa', 'aa'], ['cc', 'bb'], ['dd', 'dd']], columns=['col1', 'col2'])
>>> df
  col1 col2
0   aa   aa
1   cc   bb
2   dd   dd
>>> df[df.col1 != df.col2]
  col1 col2
1   cc   bb

我們在這里構造一個新的數據框，但是我們可以將df設置為新的數據框，例如：

df = df[df.col1 != df.col2]

Answer 2

這應該可以解決問題：

df[df[col1] != df[col2]]

Answer 3

如果只想提取各列中具有相同值的行，則應該這樣做。

import pandas as pd

data = {'a':[40, 30, 10],
       'b':[40, 20, 10]}
df = pd.DataFrame(data)
df = df[~(df['a']==df['b'])]

輸出量

如何在兩列之間刪除重復項，但在各列中保留唯一值？

問題描述

3 個解決方案

解決方案1
2 2018-10-26 23:08:37

解決方案2
2 已采納 2018-10-26 23:10:04

解決方案3
0 2018-10-27 03:51:18

如何在兩列之間刪除重復項，但在各列中保留唯一值？

問題描述

3 個解決方案

解決方案1 2 2018-10-26 23:08:37

解決方案2 2 已采納 2018-10-26 23:10:04

解決方案3 0 2018-10-27 03:51:18

解決方案1
2 2018-10-26 23:08:37

解決方案2
2 已采納 2018-10-26 23:10:04

解決方案3
0 2018-10-27 03:51:18