[英]Look for cell within a data frame and replace its value without loops R
使用此df:
DF = data.frame(m=rep(1:2,2), y=rep(1998:1999,each=2), A=c(2:5), B=c(4,NA,6,7))
> DF
m y A B
1 1 1998 2 4
2 2 1998 3 NA
3 1 1999 4 6
4 2 1999 5 7
如何使用以下值作为坐标替换单个单元格:
m = 2 ; y = 1999 ; col = 'A' ; val = 72
按照这些值,我想用72代替5。
编辑。 测试所有答案后,我意识到我的问题很基础,并不代表我的问题。 我尝试不使用for循环来执行此操作,但失败了,最终使用了它。
因此,我要替换DF
数据框中的值,但要使用其他数据框:
repl = data.frame(m=c(2,1), y=c(1999,1998), col=c('A','B'), val=c(72,100))
> repl
m y col val
1 2 1999 A 72
2 1 1998 B 100
这意味着repl
数据帧的每一行都是要在DF
替换的值。
我一直在尝试对每一行使用Psidom回答mutate(A = replace(A, m == 2 & y == 1999, 72)
1999,72 mutate(A = replace(A, m == 2 & y == 1999, 72)
,但是想知道是否可以不使用循环或不使用列名。
谢谢。
dplyr
方式是mutate
+ if_else
:
DF %>% mutate(A = if_else(m == 2 & y == 1999, 72L, A))
# m y A B
#1 1 1998 2 4
#2 2 1998 3 NA
#3 1 1999 4 6
#4 2 1999 72 7
或mutate
+ replace
:
DF %>% mutate(A = replace(A, m == 2 & y == 1999, 72))
# m y A B
#1 1 1998 2 4
#2 2 1998 3 NA
#3 1 1999 4 6
#4 2 1999 72 7
根据条件返回返回替换为预期值的新向量。
更新如果需要同时进行许多更新,则可以:
1)调整DF
以便将要更新的列聚集在单个列中;
2)在两个条件列m
和y
以及列标题列上联接;
3)更新值;
4)重新整形数据框;
因此,与tidyr
一起,您可以执行以下操作:
library(dplyr); library(tidyr)
DF %>%
gather(col, vals, -m, -y) %>%
left_join(repl, by = c("m", "y", "col")) %>%
mutate(vals = coalesce(val, vals)) %>%
select(-val) %>%
spread(col, vals)
# m y A B
#1 1 1998 2 100
#2 1 1999 4 6
#3 2 1998 3 NA
#4 2 1999 72 7
base-R中针对您的后续问题的单行方法是
lapply(1:nrow(repl), function(i)
DF[DF$m==repl$m[i] & DF$y==repl$y[i], repl$col[i]] <<- repl$val[i])
DF
m y A B
1 1 1998 2 100
2 2 1998 3 NA
3 1 1999 4 6
4 2 1999 72 7
这遍历了repl
每一行,并对DF
进行了更改。 <<-
强制其在全局环境中对原始DF
进行更改。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.