[英]How do I replace values in a data.table's column using a look up table? [R]
[英]How to swap column values in a data.table using R
我有下面给出的玩具数据。
library(data.table)
(tmp <- data.table(R1 = c('D','D','D','T','C'), y = 10:1, R2 = c('D','A','Z','D','D')))
R1 y R2
1: D 10 D
2: D 9 A
3: D 8 Z
4: T 7 D
5: C 6 D
6: D 5 D
7: D 4 A
8: D 3 Z
9: T 2 D
10: C 1 D
我想交换列R1
和R2
中的值,以便所有A
都列在 R1 下,不常见的值转到 R2。 有人可以告诉我怎么做吗? 这是所需的 output。
R1 y R2
1: D 10 D
2: D 9 A
3: D 8 Z
4: D 7 T
5: D 6 C
6: D 5 D
7: D 4 A
8: D 3 Z
9: D 2 T
10: D 1 C
以下是下面提供的答案的性能结果 -
Unit: milliseconds
expr min lq mean median uq max neval cld
akrun 5.524562 5.587740 7.526681 5.605406 5.938955 14.976740 5 b
r2evans 1.466862 1.489944 1.509321 1.500263 1.536402 1.553134 5 a
基于更新,我们可以在i
上指定一个逻辑表达式并交换要分配的列值
library(data.table)
val <- "D"
tmp[R2 == val, c("R1", "R2") := .(R2, R1)]
-输出
> tmp
R1 y R2
1: D 10 D
2: D 9 A
3: D 8 Z
4: D 7 T
5: D 6 C
6: D 5 D
7: D 4 A
8: D 3 Z
9: D 2 T
10: D 1 C
我怀疑另一个答案可能是最适用的,但如果您的需求不是基于字典排序(实际上只是存在于一组“有趣”值中),那么
interesting <- c("A")
tmp[, c("R1", "R2") := .(
fifelse(R2 %in% interesting & !R1 %in% interesting, R2, R1),
fifelse(R2 %in% interesting & !R1 %in% interesting, R1, R2))]
tmp
# x R1 R2
# <int> <char> <char>
# 1: 1 A A
# 2: 2 A F
# 3: 3 A T
# 4: 4 A G
# 5: 5 A I
# 6: 6 A A
# 7: 7 A F
# 8: 8 A T
# 9: 9 A G
# 10: 10 A I
我承认这看起来有点笨拙,重复计算条件。 这可以很容易地作为临时变量在tmp
框架内部或外部更有效地工作,例如:
tmp[, swap := R2 %in% interesting & !R1 %in% interesting
][, c("R1", "R2") := .(fifelse(swap, R2, R1), fifelse(swap, R1, R2))
][, swap := NULL]
如果您确定R2 %in% interesting
Interest 与!R2 %in% interesting
Interest 完全一致(也就是说, R1
和R2
从来都不是有趣的,...很有趣,如第 1 行和第 6 行),那么您可以将其简化为
tmp[, c("R1", "R2") := .(
fifelse(R2 %in% interesting, R2, R1),
fifelse(R2 %in% interesting, R1, R2))]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.