簡體   English   中英

計算數據幀列表中的數據幀行

[英]Count rows of dataframes within a list of dataframes

我有一個數據幀列表, str(datalist,max.level = 1)顯示

List of 9
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   200 obs. of  21 variables:
 $ :'data.frame':   41 obs. of  21 variables:

現在,數據框的21個變量中的一些變量還是數據框。 例如。 第18個變量是一個稱為topics的數據框,該數據框又包含3個變量。 如何獲得每個topics數據框中的行數?

我嘗試使用purrr包中的map()函數: x <- map(datalist, ~.x[["topics"]]) sapply(x, NROW) x <- map(datalist, ~.x[["topics"]]) ,然后使用sapply(x, NROW)但這給了我原始行數數據框,而不是topics數據框。 任何幫助,將不勝感激。

為了給你什么樣的一個例子topics數據框的樣子, datalist[[1]]$topics[[1]]

                  urlkey                   name    id
1            selfdefense           Self-Defense   443
2                martial           Martial Arts   681
3                jujitsu              Jiu Jitsu  9615
4     mixed-martial-arts     Mixed Martial Arts 15514
5             kickboxing             Kickboxing 18225
6              jiu-jitsu              Jiu-jitsu 21219
7     brazilian-jiujitsu    Brazilian Jiu-Jitsu 22237
8 mma-mixed-martial-arts MMA Mixed Martial Arts 35023
9    brazilian-jiu-jitsu    Brazilian Jiu Jitsu 46818

您描述的解決方案適合我:

舉一個可復制的例子:

datalist <- list(
  data.frame(V1 = 1:2, topics = I(list(mtcars, mtcars))),
  data.frame(V1 = 1:2, topics = I(list(mtcars, mtcars)))
)
str(datalist)
# List of 2
#  $ :'data.frame': 2 obs. of  2 variables:
# ..$ V1    : int [1:2] 1 2
# ..$ topics:List of 2
# .. ..$ :'data.frame': 32 obs. of  11 variables:
# .. .. ..$ mpg : num [1:32] 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
# .. .. ..$ cyl : num [1:32] 6 6 4 6 8 6 8 4 4 6 ...
# .. .. ..$ disp: num [1:32] 160 160 108 258 360 ...
# .. .. ..$ hp  : num [1:32] 110 110 93 110 175 105 245 62 95 123 ...
# .. .. ..$ drat: num [1:32] 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
# .. .. ..$ wt  : num [1:32] 2.62 2.88 2.32 3.21 3.44 ...
# .. .. ..$ qsec: num [1:32] 16.5 17 18.6 19.4 17 ...
# .. .. ..$ vs  : num [1:32] 0 0 1 1 0 1 0 1 1 1 ...
# .. .. ..$ am  : num [1:32] 1 1 1 0 0 0 0 0 0 0 ...
# .. .. ..$ gear: num [1:32] 4 4 4 3 3 3 3 4 4 4 ...
# .. .. ..$ carb: num [1:32] 4 4 1 1 2 1 4 2 2 4 ...
# .. ..$ :'data.frame': 32 obs. of  11 variables:
# .. .. ..$ mpg : num [1:32] 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
# .. .. ..$ cyl : num [1:32] 6 6 4 6 8 6 8 4 4 6 ...
# .. .. ..$ disp: num [1:32] 160 160 108 258 360 ...
# .. .. ..$ hp  : num [1:32] 110 110 93 110 175 105 245 62 95 123 ...
# .. .. ..$ drat: num [1:32] 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
# .. .. ..$ wt  : num [1:32] 2.62 2.88 2.32 3.21 3.44 ...
# .. .. ..$ qsec: num [1:32] 16.5 17 18.6 19.4 17 ...
# .. .. ..$ vs  : num [1:32] 0 0 1 1 0 1 0 1 1 1 ...
# .. .. ..$ am  : num [1:32] 1 1 1 0 0 0 0 0 0 0 ...
# .. .. ..$ gear: num [1:32] 4 4 4 3 3 3 3 4 4 4 ...
# .. .. ..$ carb: num [1:32] 4 4 1 1 2 1 4 2 2 4 ...
# .. ..- attr(*, "class")= chr "AsIs"
# $ :'data.frame':  2 obs. of  2 variables:
# ..$ V1    : int [1:2] 1 2
# ..$ topics:List of 2
# .. ..$ :'data.frame': 32 obs. of  11 variables:
# .. .. ..$ mpg : num [1:32] 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
# .. .. ..$ cyl : num [1:32] 6 6 4 6 8 6 8 4 4 6 ...
# .. .. ..$ disp: num [1:32] 160 160 108 258 360 ...
# .. .. ..$ hp  : num [1:32] 110 110 93 110 175 105 245 62 95 123 ...
# .. .. ..$ drat: num [1:32] 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
# .. .. ..$ wt  : num [1:32] 2.62 2.88 2.32 3.21 3.44 ...
# .. .. ..$ qsec: num [1:32] 16.5 17 18.6 19.4 17 ...
# .. .. ..$ vs  : num [1:32] 0 0 1 1 0 1 0 1 1 1 ...
# .. .. ..$ am  : num [1:32] 1 1 1 0 0 0 0 0 0 0 ...
# .. .. ..$ gear: num [1:32] 4 4 4 3 3 3 3 4 4 4 ...
# .. .. ..$ carb: num [1:32] 4 4 1 1 2 1 4 2 2 4 ...
# .. ..$ :'data.frame': 32 obs. of  11 variables:
# .. .. ..$ mpg : num [1:32] 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
# .. .. ..$ cyl : num [1:32] 6 6 4 6 8 6 8 4 4 6 ...
# .. .. ..$ disp: num [1:32] 160 160 108 258 360 ...
# .. .. ..$ hp  : num [1:32] 110 110 93 110 175 105 245 62 95 123 ...
# .. .. ..$ drat: num [1:32] 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
# .. .. ..$ wt  : num [1:32] 2.62 2.88 2.32 3.21 3.44 ...
# .. .. ..$ qsec: num [1:32] 16.5 17 18.6 19.4 17 ...
# .. .. ..$ vs  : num [1:32] 0 0 1 1 0 1 0 1 1 1 ...
# .. .. ..$ am  : num [1:32] 1 1 1 0 0 0 0 0 0 0 ...
# .. .. ..$ gear: num [1:32] 4 4 4 3 3 3 3 4 4 4 ...
# .. .. ..$ carb: num [1:32] 4 4 1 1 2 1 4 2 2 4 ...
# .. ..- attr(*, "class")= chr "AsIs"

您的解決方案:

library(purrr)
map(datalist, ~ sapply(.x[["topics"]], NROW))
# [[1]]
# [1] 32 32
# 
# [[2]]
# [1] 32 32
count_rows <- function(dfs) {
nrow(dfs$topics)
}
count <- lapply(datalist, count_rows)

count_rows函數只是將列表中的每個數據count_rows集化,然后將nrow應用於“主題”數據nrow

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM