[英]importing multiple .csv files and selecting same variabls from multiple data frames using r
使用 RI 我想使用循環功能導入幾個 .csv 文件。 .csv 文件是幾個月的相同數據示例:
Datafile_Jan19.csv
Datafile_Feb19.csv
Datafile_Mar19.csv
Datafile_Apr19.csv
因此,不要為每個文件輸入導入代碼:
Jan19 = import("C:/Users/Manfred Kuhn/Documents/Board Report/Mozambique/Datafile_Jan19.csv",
integer64 = "double")
其次,從每個文件中,我只想選擇特定的變量:
Jan19new = Jan19 %>%
select(CUSTOMER_ID, CUSTOMER_NAME, ACCOUNT_ID, PERIOD, TIME_ON_BOOK,
ORIGINATION_DATE, MATURITY_DATE, LIMIT, PRODUCT_LEVEL1, PRODUCT_LEVEL2,
ARREARS_STATUS)
這個變量選擇可以循環完成嗎?
您可以獲取文件列表並加載所有文件,只需使用 plyr::ldply 選擇您需要的變量:
#Set data location
path <- "files_path"
#Get files
file <- list.files(path)
#Load Data
data <- plyr::ldply(paste(path,file,sep = ""), read_csv,locale = locale(encoding = "WINDOWS-1252"))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.