[英]Using R, how can someone count the number of pages in a PDF file?
我在目錄中有大約一百個長PDF文件,並想知道R是否可以計算每個文件中有多少頁面。 我的操作系統是Windows 8。
以下是10頁PDF文件的鏈接,以防這有助於您測試解決方案。 MWE pdf文件
似乎可以使用python計算PDF頁面,但我不知道語言python解決方案 。 已經使用例如Imagemagick在SO上討論了其他解決方案。 和C ##。
我正在使用Windows 7機器,但我在Windows 8上的經驗讓我覺得它應該對你有用。
我無法編譯Rpoppler
包,正如hrbrmstr指出的那樣,它可能不值得戰斗。 如果你有7-Zip,你可以提取Windows的poppler工具。 我已將它們提取到位置C:\\poppler
。 到那里,我可以做到以下幾點
file_name <- "C:/[file_path]/whitepaper-pdfprimer.pdf"
pdf_pages <- function(file_name){
require(magrittr)
pages <- system2("C:/poppler/bin/pdfinfo.exe",
args = file_name,
stdout = TRUE)
pages[grepl("Pages:", pages)] %>%
gsub("Pages:", "", .) %>%
as.numeric()
}
pdf_pages(file_name)
如果你有一個你希望傳遞的文件名向量
vapply(file_names, pdf_pages, numeric(1))
感謝@hrbrmstr指出了poppler工具(我直到今天才聽說過它們)。
在R版本3.3.2上pdftools
工作原理:
library(pdftools)
pdfInfo <- pdf_info(<path to PDF file>)
pdfInfo$pages
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.