簡體   English   中英

維護 PyPDF2 的替代品

[英]Maintained alternatives to PyPDF2

我正在使用PyPDF2庫從 pdf 文檔中提取文本、圖像、頁面寬度和高度、注釋和其他屬性。 但是,該庫有許多錯誤和問題,並且似乎已經很久沒有維護了。 (編輯: PyPDF2 再次維護

  • 有沒有更生動的分叉正在維護和開發?
  • 有沒有好的選擇?

據我所知, reportlab更適合創建全新的 pdf(或者我對 reportlab 的經驗不足)。

更新:再次維護 PyPDF2 - 我是維護者:-) 我剛剛發布了一個帶有幾個錯誤修復的新版本。


維護的三個潛在替代方案(就像 PyPDF2 一樣):

我不會使用:

  • PyPDF3 ( pypi ):與 PyPDF2 相比,活動更少,功能可能更少。
  • PyPDF4 ( pypi ):2018 年 PyPI 上的最后一個版本

PyMuPDF是一個用於 MuPDF 的 Python 綁定——一個輕量級的 PDF 和 XPS 查看器 因為 MuPDF 不僅支持 PDF 還支持 XPS、OpenXPS、CBZ、CBR、FB2 和 EPUB 格式,所以 PyMuPDF 也支持。 PyMuPDF 托管在GitHub上。 我們也在PyPI上注冊。

它的性能統計數據也非常有希望。 以下是處理性能不同方面的三個部分:

  • 文檔解析
  • 文本提取
  • 圖像渲染

PyMuPDF 比 pdfrw、PyPDF2 和 pdftk 更快。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM