繁体   English   中英

在数据帧中查找单元格并替换其值而无需循环R

[英]Look for cell within a data frame and replace its value without loops R

使用此df:

  DF = data.frame(m=rep(1:2,2), y=rep(1998:1999,each=2), A=c(2:5), B=c(4,NA,6,7))

> DF
  m    y A  B
1 1 1998 2  4
2 2 1998 3 NA
3 1 1999 4  6
4 2 1999 5  7

如何使用以下值作为坐标替换单个单元格:

m = 2 ; y = 1999 ; col = 'A' ; val = 72

按照这些值,我想用72代替5。


编辑。 测试所有答案后,我意识到我的问题很基础,并不代表我的问题。 我尝试不使用for循环来执行此操作,但失败了,最终使用了它。

因此,我要替换DF数据框中的值,但要使用其他数据框:

repl = data.frame(m=c(2,1), y=c(1999,1998), col=c('A','B'), val=c(72,100))
> repl
  m    y col val
1 2 1999   A  72
2 1 1998   B 100

这意味着repl数据帧的每一行都是要在DF替换的值。

我一直在尝试对每一行使用Psidom回答mutate(A = replace(A, m == 2 & y == 1999, 72) 1999,72 mutate(A = replace(A, m == 2 & y == 1999, 72) ,但是想知道是否可以不使用循环或不使用列名。

谢谢。

dplyr方式是mutate + if_else

DF %>% mutate(A = if_else(m == 2 & y == 1999, 72L, A))

#  m    y  A  B
#1 1 1998  2  4
#2 2 1998  3 NA
#3 1 1999  4  6
#4 2 1999 72  7

mutate + replace

DF %>% mutate(A = replace(A, m == 2 & y == 1999, 72))

#  m    y  A  B
#1 1 1998  2  4
#2 2 1998  3 NA
#3 1 1999  4  6
#4 2 1999 72  7

根据条件返回返回替换为预期值的新向量。


更新如果需要同时进行许多更新,则可以:

1)调整DF以便将要更新的列聚集在单个列中;

2)在两个条件列my以及列标题列上联接;

3)更新值;

4)重新整形数据框;

因此,与tidyr一起,您可以执行以下操作:

library(dplyr); library(tidyr)

DF %>% 
    gather(col, vals, -m, -y) %>% 
    left_join(repl, by = c("m", "y", "col")) %>% 
    mutate(vals = coalesce(val, vals)) %>% 
    select(-val) %>% 
    spread(col, vals)

#  m    y  A   B
#1 1 1998  2 100
#2 1 1999  4   6
#3 2 1998  3  NA
#4 2 1999 72   7

base-R中针对您的后续问题的单行方法是

lapply(1:nrow(repl), function(i) 
       DF[DF$m==repl$m[i] & DF$y==repl$y[i], repl$col[i]] <<- repl$val[i])

DF
  m    y  A   B
1 1 1998  2 100
2 2 1998  3  NA
3 1 1999  4   6
4 2 1999 72   7

这遍历了repl每一行,并对DF进行了更改。 <<-强制其在全局环境中对原始DF进行更改。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM