
[英]R Markdown: Create PDF in a folder A and save PDF in another folder B
[英]Save PDF to a specific folder if it contains the name in R
我有 50 个 PDF 文件的列表。 我正在从每个 PDF 中提取名称。 该名称可能出现在多个 PDF 文件中。 我想创建一个名为“名称”的文件夹并将包含该名称的每个文件保存到该文件夹中。
Example:
PDF1 contains name "Josh"
PDF2 contains name "Tatiyana.N"
PDF3 contains name "Tatiyana.N"
PDF2 contains name "Yara"
所以 - 应创建名为“Josh”、“Tatiyana.N”和“Yara”的 3 个文件夹,并将 PDF1 保存在文件夹“Josh”中,PDF2 和 PDF3 保存在“Tatiyana.N”中,PDF4 保存在“Yara”中。
我的代码(R 3.6.3)
article_path <- list.files( pattern = "pdf$")
#read in article using lapply
article <- lapply(article_path, pdf_text)
#convert to chr class
article <- as.character(article)
get_data <- function(dat) {
list(Name = str_trim(str_extract(dat, "(?<=Name:)(?s)(.*?)(?=Place)")),
Place = str_trim(str_extract(dat, "(?<=Place)(.*?)(?=cost)"))
)
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.