[英]Specify which columns are the same when using map_dfr
我有两个文件夹,每个文件夹都有数百个 CSV,我想将它们全部合并到一个数据框中。 我使用了以下内容:
tbl <-
list.files(path = c("./reports_0", "./reports_1"),
pattern = "*.csv",
full.names = T) %>%
map_dfr(~read_csv(., col_types = cols(.default = "c")))
现在我意识到其中一些 CSV 的列名是固件版本,有些是固件版本(大写和小写)。
我想指定它们是相同的,并且可以组合成一个称为固件版本的版本。
这
by =
不起作用,我找不到解决方案。
希望有人能帮忙,谢谢!
编辑
我的解决方法是:
tbl <- tbl %>%
unite(`Firmware Version`, `Firmware version`, na.rm = T) %>%
mutate(`Firmware Version` = replace(`Firmware Version`, `Firmware Version`=="", NA_character_))
但是,我仍然想知道是否有更好,更直接的方法。
您可以使用janitor::make_clean_names()
将列名转换为相同的格式(例如 camelCase),然后进行行绑定。
例如:
library(data.table)
library(janitor)
ftr <- list.files(path = c("./reports_0", "./reports_1"),
pattern = ".*\\.csv$",
names = TRUE)
DT <- rbindlist(
lapply(ftr, function(x) {
tempDT <- fread(x)
setnames(tempDT, names(tempDT), janitor::make_clean_names(names(tempDT)))
return(tempDT)
}), use.names = TRUE, fill = TRUE)
概念证明
将名称转换为 snake_case
> janitor::make_clean_names("Firmware Version")
[1] "firmware_version"
> janitor::make_clean_names("Firmware version")
[1] "firmware_version"
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.