繁体   English   中英

如果 PDF 包含 R 中的名称,则将其保存到特定文件夹

[英]Save PDF to a specific folder if it contains the name in R

我有 50 个 PDF 文件的列表。 我正在从每个 PDF 中提取名称。 该名称可能出现在多个 PDF 文件中。 我想创建一个名为“名称”的文件夹并将包含该名称的每个文件保存到该文件夹中。

Example:
PDF1 contains name "Josh"
PDF2 contains name "Tatiyana.N"
PDF3 contains name "Tatiyana.N"
PDF2 contains name "Yara"

所以 - 应创建名为“Josh”、“Tatiyana.N”和“Yara”的 3 个文件夹,并将 PDF1 保存在文件夹“Josh”中,PDF2 和 PDF3 保存在“Tatiyana.N”中,PDF4 保存在“Yara”中。

我的代码(R 3.6.3)

article_path <- list.files( pattern = "pdf$")

#read in article using lapply
article <- lapply(article_path, pdf_text)

#convert to chr class
article <- as.character(article)

get_data <- function(dat) {
  list(Name = str_trim(str_extract(dat, "(?<=Name:)(?s)(.*?)(?=Place)")),
       Place = str_trim(str_extract(dat, "(?<=Place)(.*?)(?=cost)"))

  )
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM