簡體   English   中英

使用R,有人如何計算PDF文件中的頁數?

[英]Using R, how can someone count the number of pages in a PDF file?

我在目錄中有大約一百個長PDF文件,並想知道R是否可以計算每個文件中有多少頁面。 我的操作系統是Windows 8。

以下是10頁PDF文件的鏈接,以防這有助於您測試解決方案。 MWE pdf文件

似乎可以使用python計算PDF頁面,但我不知道語言python解決方案 已經使用例如Imagemagick在SO上討論了其他解決方案。 和C ##。

我正在使用Windows 7機器,但我在Windows 8上的經驗讓我覺得它應該對你有用。

我無法編譯Rpoppler包,正如hrbrmstr指出的那樣,它可能不值得戰斗。 如果你有7-Zip,你可以提取Windows的poppler工具。 我已將它們提取到位置C:\\poppler 到那里,我可以做到以下幾點

file_name <- "C:/[file_path]/whitepaper-pdfprimer.pdf"

pdf_pages <- function(file_name){
  require(magrittr)
  pages <- system2("C:/poppler/bin/pdfinfo.exe",
                   args = file_name,
                   stdout = TRUE)
  pages[grepl("Pages:", pages)] %>%
    gsub("Pages:", "", .) %>%
    as.numeric()
}

pdf_pages(file_name)

如果你有一個你希望傳遞的文件名向量

vapply(file_names, pdf_pages, numeric(1))

感謝@hrbrmstr指出了poppler工具(我直到今天才聽說過它們)。

在R版本3.3.2上pdftools工作原理:

library(pdftools)
pdfInfo <- pdf_info(<path to PDF file>)
pdfInfo$pages

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM