R 循环将相同的功能应用于多个数据帧

Question

我有多个数据框，我需要在其中应用相同的功能（唯一）

df1 = data.frame(Bird_ID = c(1:6,7,7,6,2,1))
df2 = data.frame(Bird_ID = c(1:10,7,7,6,2,1,10,9,3))

在每个 df 我想应用以下函数来向我显示唯一的个人列表：

individuals1 = data.frame(length(unique(df1[,1])))
individuals2 = data.frame(length(unique(df2[,1])))

这里我们有7 个和10 个唯一 ID。 这很容易，但问题是有时我有不止 2 个 df。 如何将唯一函数应用于所有数据帧并具有1 个输出数据帧，它为我提供每个 df 的唯一个体数量，如下所示：

output = data.frame(Index = c("Unique.ID"), df1 = c(7),df2=c(10))

#index df1 df2
#Unique.ID 7 10

Answer 1

有很多方法可以实现这一目标。 这是使用dplyr包中的函数的一种方法

library("dplyr")
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union

df1 = data.frame(Bird_ID = c(1:6,7,7,6,2,1))
df2 = data.frame(Bird_ID = c(1:10,7,7,6,2,1,10,9,3))

# combine the dataframes into a named list, for convenience
df_list <- list(df1 = df1, df2 = df2)

# bind, group, and summarise
bind_rows(df_list, .id = "df_name") %>%
  group_by(df_name) %>%
  summarise(n_unique = length(unique(Bird_ID)))
#> # A tibble: 2 × 2
#>   df_name n_unique
#>   <chr>      <int>
#> 1 df1            7
#> 2 df2           10

^{由reprex 包(v2.0.1) 于 2021 年 10 月 26 日创建}

Answer 2

df1 = data.frame(Bird_ID = c(1:6,7,7,6,2,1))
df2 = data.frame(Bird_ID = c(1:10,7,7,6,2,1,10,9,3))

l <- mget(x = ls(pattern = "df"))

library(tidyverse)
map_df(l, ~n_distinct(.x[[1]]))
#> # A tibble: 1 x 2
#>     df1   df2
#>   <int> <int>
#> 1     7    10

^{由reprex 包(v2.0.1) 于 2021 年 10 月 26 日创建}

根据

sapply(l, function(x) length(unique(x[[1]])))

df1 df2 
  7  10

R 循环将相同的功能应用于多个数据帧

问题描述

2 个解决方案

解决方案1
1 已采纳 2021-10-26 10:31:31

解决方案2
1 2021-10-26 10:42:30

R 循环将相同的功能应用于多个数据帧

问题描述

2 个解决方案

解决方案1 1 已采纳 2021-10-26 10:31:31

解决方案2 1 2021-10-26 10:42:30

解决方案1
1 已采纳 2021-10-26 10:31:31

解决方案2
1 2021-10-26 10:42:30