繁体   English   中英

R purrr:map 在分组/嵌套的小标题上

[英]R purrr:map on a grouped/nested tibble

我想在嵌套分组 tibble 的列中应用 function,如下例所示。

library(tidyverse)
df <- swiss %>%
  group_by(Catholic > 20) %>%
  nest()

这会产生一个看起来像这样的小标题:

> df
# A tibble: 2 x 2
# Groups:   Catholic > 20 [2]
  `Catholic > 20` data             
  <lgl>           <list>           
1 FALSE           <tibble [26 × 6]>
2 TRUE            <tibble [21 × 6]>

现在我制作了一些 function 来构建 model

fit <- function(df, modL = NA){
  if (modL == 1) {fit <- lm(Fertility ~ Education, data = df)}
  if (modL == 2) {fit <- lm(Fertility ~ Education + Examination, data = df)}
  fit
}

现在我将 map 将 model 放到分组数据的列中,并创建两个新变量来存储 model 拟合。

df <- df %>%
  mutate(model1 = map(data, fit, modL = 1)) %>%
  mutate(model2 = map(data, fit, modL = 2)) 

这会产生一个包含两个新列的小标题,其中包含 model 适合

> df
# A tibble: 2 x 4
# Groups:   Catholic > 20 [2]
  `Catholic > 20` data              model1 model2
  <lgl>           <list>            <list> <list>
1 FALSE           <tibble [26 × 6]> <lm>   <lm>  
2 TRUE            <tibble [21 × 6]> <lm>   <lm> 

我想要实现的是一个 purr 型 map function 与以下代码执行相同的操作。

anova(df$model1[[1]], df$model2[[1]])
anova(df$model1[[2]], df$model2[[2]])

我虽然下面的代码可以工作,但它没有。

map(df[,3:4], anova)

大师们,我如何在嵌套和分组数据集的列中使用 map 和 function 以使用该行的列作为输入为每行提供一个结果?

布兰特


df %>%
  mutate(anova = map2(model1, model2, ~ anova(.x,.y)))%>%
  mutate(pvalue = map_dbl(anova, ~.$`Pr(>F)`[2]))


我想这就是你想要的? 你能澄清一下吗? 第二个变异将提取每个成对比较的 anova 的 p 值。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM