R：比这个for-loop更有效的解决方案

Question

I wrote a functioning for loop, but it's slow over thousands of rows and I'm looking for more efficient alternative. 我写了一个函数for循环，但它在数千行上很慢，我正在寻找更有效的替代方案。 Thanks in advance! 提前致谢！

The task: 任务：

If column a matches column b , column d becomes NA . 如果列a与列b匹配，则列d变为NA 。
If column a does not match b , but b matches c , then column e becomes NA . 如果列a与b不匹配，但b与c匹配，则列e变为NA 。

The for loop: for循环：

for (i in 1:nrow(data)) {
     if (data$a[i] == data$b[i]) {data$d[i] <- NA}
     if (!(data$a[i] == data$b[i]) & data$b[i] == data$c[i])
        {data$e[i] <- NA}
}

An example: 一个例子：

a    b    c    d    e
F    G    G    1    10
F    G    F    5    10
F    F    F    2    8

Would become: 会成为：

a    b    c    d    e
F    G    G    1    NA
F    G    F    5    10
F    F    F    NA    8

Answer 1

If you're concerned about speed and efficiency, I'd recommend data.table (though technically vectorizing a normal data.frame as recommended by @parfait would probably speed things up more than enough) 如果您担心速度和效率，我建议使用data.table （虽然技术上按照data.frame推荐的正常data.frame矢量化可能会加快速度）

library(data.table)

DT <- fread("a    b    c    d    e
             F    G    G    1    10
             F    G    F    5    10
             F    F    F    2    8")
print(DT)
#    a b c d  e
# 1: F G G 1 10
# 2: F G F 5 10
# 3: F F F 2  8

DT[a == b, d := NA]
DT[!a == b & b == c, e := NA]

print(DT)
#    a b c  d  e
# 1: F G G  1 NA
# 2: F G F  5 10
# 3: F F F NA  8

Answer 2

Suppose df is your data then: 假设df是你的数据：

ab <- with(df, a==b)
bc <- with(df, b==c)

df$d[ab] <- NA
df$e[!ab & bc] <- NA

which would result in 这将导致

#   a b c  d  e
# 1 F G G  1 NA
# 2 F G F  5 10
# 3 F F F NA  8

Answer 3

We could create a list of quosure and evaluate it 我们可以创建一个quosure列表并对其进行评估

library(tidyverse)
qs <- setNames(quos(d*NA^(a == b), e*NA^((!(a ==b) & (b == c)))), c("d", "e"))
df1 %>%
    mutate(!!! qs)
#  a b c  d  e
#1 F G G  1 NA
#2 F G F  5 10
#3 F F F NA  8

R：比这个for-loop更有效的解决方案

问题描述

3 个解决方案

解决方案1
4 已采纳 2018-05-22 15:09:26

解决方案2
2 2018-05-22 15:22:02

解决方案3
0 2018-05-22 15:19:37

R：比这个for-loop更有效的解决方案

问题描述

3 个解决方案

解决方案1 4 已采纳 2018-05-22 15:09:26

解决方案2 2 2018-05-22 15:22:02

解决方案3 0 2018-05-22 15:19:37

解决方案1
4 已采纳 2018-05-22 15:09:26

解决方案2
2 2018-05-22 15:22:02

解决方案3
0 2018-05-22 15:19:37