[英]Import sheets from Excel files located in different folder in R
基本上,我在两个不同的文件夹中有两个具有相同名称“ Checklist”的Excel文件(一个是2018,另一个是2019)。 清单有不同的工作表,每个月一个:“一月”,“二月”等...当然,所有工作表的变量都完全相同。 我想将两个Excel文件中的所有工作表放在同一数据框中。 现在,我可以使用以下命令从一个Excel文件中收集工作表:
library(readxl)
library(tibble)
read_excel_allsheets <- function(filename, tibble = TRUE) {
sheets <- readxl::excel_sheets(filename)
x <- lapply(sheets, function(X) readxl::read_excel(filename, sheet = X))
if(!tibble) x <- lapply(x, as.data.frame)
names(x) <- sheets
x
}
mysheets <-read_excel_allsheets("C:/Users/Thiphaine/Documents/2018/Checklist.xlsx")
library(dplyr)
mysheets<-bind_rows(mysheets, .id = "column_label")
我只是不知道如何创建一个循环,该循环将穿过文件夹2018和2019从两个Excel文件中收集所有工作表。 这个想法还将是,到2020年,我将有另一个文件夹“ 2020”应包括在内...有任何想法吗? 谢谢
尝试这个:
library(dplyr)
allsheets <- list()
for(file in list.files(path = "PATH/TO/DCUMENTS/",
recursive = TRUE, pattern = "*.xlsx", full.names = TRUE)) {
mysheets <- read_excel_allsheets(file)
mysheets <- bind_rows(mysheets, .id = "column_label")
allsheets[[file]] <- mysheets
}
其中PATH/TO/DOCUMENTS
可能类似于"C:/Users/Thiphaine/Documents/
”。
如果您愿意,也可以使用tidyverse
方法对其进行矢量化。 特别是因为所有文件都是相同的(列名),并且您最终要使用data.frame
。
require(tidyverse)
df <- list.files(path = "your_path",
full.names = TRUE,
recursive = TRUE,
pattern = "*.xls") %>%
tbl_df() %>%
mutate(sheetName = map(value, readxl::excel_sheets)) %>%
unnest(sheetName) %>%
mutate(myFiles = purrr::map2(value, sheetName, function(x,y) {
readxl::read_excel(x, sheet = paste(y))})) %>%
unnest(myFiles)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.