[英]Map nested data by row r
我有这样的数据(再次感谢 dput!):
dat <- structure(list(vars = c("var_1", "var_2"), data = list(structure(list(
time = 1:10, value = c(1:10
)), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"
)), structure(list(time = 1:10, value = c(11:20
)), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"
))), mu = c(1, 2), stdev = c(1,2)), class = c("tbl_df", "tbl", "data.frame"),
row.names = c(NA,-2L))
我试图改变一个额外的列,它在每一行上映射一个函数。 例如,使用dat$mu[1]
和dat$stdev[1]
计算dat$data[[1]]$value
嵌套变量的每个元素的 dnorm,然后继续对第二行执行相同的操作。
我想改变的列是包含它作为输出的每一行的小标题 [10 x 1]:
dnorm(dat$data[[1]]$value, mean = dat$mu[1], sd = dat$stdev[1])
dnorm(dat$data[[2]]$value, mean = dat$mu[2], sd = dat$stdev[2])
我尝试过但不起作用但可能接近的事情?:
# This alternates between mean and stdev for each element of each nested variable
dat_1 <- dat %>%
mutate(z = map(data, ~ dnorm(.x$value, mean = dat$mu, sd = dat$stdev)))
# apply by row has structure issues
dat_2 <- dat %>%
apply(MARGIN = 1, function(x){
mutate(x, z = map(data, ~ dnorm(.x$value, mean = dat$mu, sd = dat$stdev)))
})
像这样的基本映射函数dat_3 <- dat %>% mutate(sigma = map(data, ~ sum(.x$value)))
工作正常,而无需引用 df 中的其他值。 这是我以这种方式使用嵌套数据和地图的早期阶段 - 一直在查看所有地图功能的文档以尝试解决这个问题,但还没有运气! 如果这很清楚,我可以尝试澄清 - 在此先感谢!
我们可以使用并行映射:
library(purrr)
library(dplyr)
expected_out1 <- dnorm(dat$data[[1]]$value, mean = dat$mu[1], sd = dat$stdev[1])
expected_out2 <- dnorm(dat$data[[2]]$value, mean = dat$mu[2], sd = dat$stdev[2])
out <-
dat %>%
mutate(z = pmap(list(map(data, "value"), mu, stdev), dnorm))
all.equal(out$z, list(expected_out1, expected_out2))
# [1] TRUE
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.