繁体   English   中英

在数据框列表 R 中拆分列

[英]Split Columns in a List of Dataframes R

我有一个数据框列表,其中某些列具有此特殊字符-> (箭头)。 现在我确实想遍历这个数据框列表并用这个-> (箭头)定位列,然后用后缀_old和_new命名新列。 这是数据帧的示例:

dput(df1)
df1 <- structure(list(v1 = c("reg->joy", "ress", "mer->dls"),
                      t2 = c("James","Jane", "Egg")),
                 class = "data.frame", row.names = c(NA,  -3L))

dput(df2)
df2 <- structure(list(v1 = c("me", "df", "kl"),
                      t2 = c("James","Jane->dlt", "Egg"),
                      t3 = c("James ->may","Jane", "Egg")),
                 class = "data.frame", row.names = c(NA,  -3L))
dput(df3)
df3 <- structure(list(v1 = c("56->34", "df23-> ", "mkl"),
                      t2 = c("James","Jane", "Egg"),
                      d3 = c("James->","Jane", "Egg")),
                 class = "data.frame", row.names = c(NA,  -3L))

这是我尝试过的

dfs <- list(df1,df2,df3)

for (y in 1:length(dfs)){
  setDT(dfs[[y]])
  df1<- lapply(names(dfs[[y]]), function(x) {
    mDT <- df2[[y]][, tstrsplit(get(x), " *-> *")]
    if (ncol(mDT) == 2L) setnames(mDT, paste0(x, c("_old", "_new")))
  }) %>% as.data.table()

}

这只会拆分一个数据帧,我需要拆分所有数据帧。 注意:我在一个 dataframe 上拆分得很好的代码,我想要的是如何在数据帧列表上实现它

预期 OUTPUT


dput(df1)
df1 <- structure(list(v1_old = c("reg", "mer"),
                      v1_new = c("joy", "dls")),
                 class = "data.frame", row.names = c(NA,  -3L))

dput(df2)
df2 <- structure(list(t2_old = c("dlt"),
                      t2_new = c("dlt"),
                      t3_old = c("James"),
                      t3_new = c("may")),
                 class = "data.frame", row.names = c(NA,  -3L))

dput(df3)
df3 <- structure(list(v1_old = c("56", "df23 "),
                      v1_new = c("34", " "),
                      d3 = c("James"),
                      d3 = c(" ")),
                 class = "data.frame", row.names = c(NA,  -3L))

我在下面添加了一个使用 tidyverse 的解决方案。

如果列中的字符串之一包含箭头,则 Select 列:

col_arrow_ls <- purrr::map(dfs, ~select_if(., ~any(str_detect(., "->"))))

然后使用 tidyr::separate 拆分 function。 由于 output 的每个元素都是一个数据框,因此使用 purrr::map_dfc 将它们列绑定在一起:

split_df_fn <- function(df1){
  names(df1) %>%
    map_dfc(~ df1 %>% 
               select(.x) %>% 
               tidyr::separate(.x, 
                               into = paste0(.x, c("_old", "_new")), 
                               sep = "->")
    )
}

将 function 应用于数据帧列表。

purrr::map(col_arrow_ls, split_df_fn)

[[1]]
  v1_old v1_new
1    reg    joy
2   ress   <NA>
3    mer    dls

[[2]]
  t2_old t2_new t3_old t3_new
1  James   <NA> James     may
2   Jane    dlt   Jane   <NA>
3    Egg   <NA>    Egg   <NA>

[[3]]
  v1_old v1_new d3_old d3_new
1     56     34  James       
2   df23          Jane   <NA>
3    mkl   <NA>    Egg   <NA>

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM