用R中的NA替換列中的所有重復元素

Question

如何用r 中的 na替換列中的所有重復元素？ 這是我正在使用的數據的示例子集：

> df.1
         V1      V2      V3      V4
X1    4D+44  18D+30 125D+44   4D+48
X2     NONE    NONE 125D+44    NONE
X3     NONE    NONE 125D+44    NONE
X4  29D+139 18D+124 125D+44  4D+133
X5  29D+139  5D+164 125D+44    NONE
X6  30D+174  9D+194    NONE    NONE
X7   6D+227  4D+225    NONE 39D+217
X8     NONE    NONE    NONE 39D+217
X9   4D+285    NONE    NONE    NONE
X10    NONE    NONE    NONE    NONE

在每一列中，我想用NA替換重復的元素。 例如，我希望V1看起來像這樣：

4D+44 NA NA NA NA 30D+174 6D+227 NA 4D+285 NA

我能得到的最接近結果是通過使用duplicated()

> df.1$V1[duplicated(df.1$V1)] <- NA
> df[df == "NONE"] <- NA

但它導致V1看起來像這樣，保留重復元素的第一個值。

4D+44 NA NA 29D+139 NA 30D+174 6D+227 NA 4D+285 NA

有沒有辦法識別和替換所有重復的元素？

感謝您的答復。

Answer 1

我們可以使用duplicated來創建一個邏輯索引，並用它來replace NA replace每一列

df1[] <- lapply(df1, function(x) 
       replace(x, duplicated(x)|duplicated(x, fromLast = TRUE),  NA))

或者用dplyr

library(dplyr)
df1 %>%
  mutate_all(~ replace(., duplicated(.)|duplicated(., fromLast = TRUE), NA))

數據

df1 <- structure(list(V1 = c("4D+44", "NONE", "NONE", "29D+139", "29D+139", 
"30D+174", "6D+227", "NONE", "4D+285", "NONE"), V2 = c("18D+30", 
"NONE", "NONE", "18D+124", "5D+164", "9D+194", "4D+225", "NONE", 
"NONE", "NONE"), V3 = c("125D+44", "125D+44", "125D+44", "125D+44", 
"125D+44", "NONE", "NONE", "NONE", "NONE", "NONE"), V4 = c("4D+48", 
"NONE", "NONE", "4D+133", "NONE", "NONE", "39D+217", "39D+217", 
"NONE", "NONE")), class = "data.frame", row.names = c("X1", "X2", 
"X3", "X4", "X5", "X6", "X7", "X8", "X9", "X10"))

用R中的NA替換列中的所有重復元素

問題描述

1 個解決方案

解決方案1
0 已采納 2020-03-24 18:25:01

數據

用R中的NA替換列中的所有重復元素

問題描述

1 個解決方案

解決方案1 0 已采納 2020-03-24 18:25:01

數據

解決方案1
0 已采納 2020-03-24 18:25:01