[英]Import sheets from Excel files located in different folder in R
基本上,我在兩個不同的文件夾中有兩個具有相同名稱“ Checklist”的Excel文件(一個是2018,另一個是2019)。 清單有不同的工作表,每個月一個:“一月”,“二月”等...當然,所有工作表的變量都完全相同。 我想將兩個Excel文件中的所有工作表放在同一數據框中。 現在,我可以使用以下命令從一個Excel文件中收集工作表:
library(readxl)
library(tibble)
read_excel_allsheets <- function(filename, tibble = TRUE) {
sheets <- readxl::excel_sheets(filename)
x <- lapply(sheets, function(X) readxl::read_excel(filename, sheet = X))
if(!tibble) x <- lapply(x, as.data.frame)
names(x) <- sheets
x
}
mysheets <-read_excel_allsheets("C:/Users/Thiphaine/Documents/2018/Checklist.xlsx")
library(dplyr)
mysheets<-bind_rows(mysheets, .id = "column_label")
我只是不知道如何創建一個循環,該循環將穿過文件夾2018和2019從兩個Excel文件中收集所有工作表。 這個想法還將是,到2020年,我將有另一個文件夾“ 2020”應包括在內...有任何想法嗎? 謝謝
嘗試這個:
library(dplyr)
allsheets <- list()
for(file in list.files(path = "PATH/TO/DCUMENTS/",
recursive = TRUE, pattern = "*.xlsx", full.names = TRUE)) {
mysheets <- read_excel_allsheets(file)
mysheets <- bind_rows(mysheets, .id = "column_label")
allsheets[[file]] <- mysheets
}
其中PATH/TO/DOCUMENTS
可能類似於"C:/Users/Thiphaine/Documents/
”。
如果您願意,也可以使用tidyverse
方法對其進行矢量化。 特別是因為所有文件都是相同的(列名),並且您最終要使用data.frame
。
require(tidyverse)
df <- list.files(path = "your_path",
full.names = TRUE,
recursive = TRUE,
pattern = "*.xls") %>%
tbl_df() %>%
mutate(sheetName = map(value, readxl::excel_sheets)) %>%
unnest(sheetName) %>%
mutate(myFiles = purrr::map2(value, sheetName, function(x,y) {
readxl::read_excel(x, sheet = paste(y))})) %>%
unnest(myFiles)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.