在bash腳本linux中的不同列中刪除相同值的重復項

Question

我有一個這樣的文件：

A2M TIAM1

AARSD1 NLRP12

ABCA12 ABCA1

ABCA12 NR1H2

ABCA1 ABCA12

ABCA13 APOA2

ABCA13 CLK1

NLRP12 AARSD1

ABCA13 HAGH

ABCC10 ATP2B2

我想擺脫重復的值col2 col1。 例如：

ABCA1 ABCA12

...和：

NLRP12 AARSD1

...在這種情況下。

Bash腳本中最好的方法是什么？

Answer 1

這是使用awk ：

awk '!seen[$1]++ && !seen[$2]++' your-file

根據您的輸入，這將僅打印在col1和col2中找到的唯一值，這將是輸出：

A2M TIAM1
AARSD1 NLRP12
ABCA12 ABCA1
ABCA13 APOA2
ABCC10 ATP2B2

要按不同對分組，請嘗試以下操作：

awk '!seen[$1 $2]++ && !seen[$2 $1]++' your-file

這將是輸出：

A2M TIAM1
AARSD1 NLRP12
ABCA12 ABCA1
ABCA12 NR1H2
ABCA13 APOA2
ABCA13 CLK1
ABCA13 HAGH
ABCC10 ATP2B2