[英]How to FOR and IF loop in R to sum values according to two factor levels and create new variable?
[英]How to combine two variables according to levels of a factor in R
我正在努力解决一个可能非常基本的问题,但我无法找到解决方案。 我非常感谢任何帮助。
我有一个包含两个变量的数据框,我想在同一个变量中合并。 数据框看起来像这样:
id <- 1:6
color <- c(rep("red", 3), "blue", "red", "blue")
value2 <- 20:25
value1 <- 25:30
wanted_outcome <- c(25,26,27,23,29,25)
data_sample <- data.frame(id, color, value1, value2, wanted_outcome)
data_sample
id color value1 value2 wanted_outcome
1 1 red 25 20 25
2 2 red 26 21 26
3 3 red 27 22 27
4 4 blue 28 23 23
5 5 red 29 24 29
6 6 blue 30 25 25
我想要的结果是在最后一栏。 基本上我想创建一个新变量,它包含红色项的变量value1和蓝色项的value2的值。
这是我正在尝试的,但是,它没有产生所需的结果,因为R正在替换从第一个开始而不是逐行的值。
data_sample$value_combined[color=="red"] <- value1
data_sample$value_combined[color=="blue"] <- value2
data_sample
id color value1 value2 wanted_outcome value_combined
1 1 red 25 20 25 25
2 2 red 26 21 26 26
3 3 red 27 22 27 27
4 4 blue 28 23 23 20
5 5 red 29 24 29 28
6 6 blue 30 25 25 21
任何帮助,将不胜感激。 提前致谢。
使用ifelse
(慢,但很容易):
data_sample <- transform(data_sample,
wanted = ifelse(color == "red",
value1,
ifelse(color == "blue",
value2,
NA)))
要么
data_sample <- transform(data_sample,
wanted = ifelse(color == "red",
value1,
value2))
如果只有那两种颜色。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.