繁体   English   中英

维护 PyPDF2 的替代品

[英]Maintained alternatives to PyPDF2

我正在使用PyPDF2库从 pdf 文档中提取文本、图像、页面宽度和高度、注释和其他属性。 但是,该库有许多错误和问题,并且似乎已经很久没有维护了。 (编辑: PyPDF2 再次维护

  • 有没有更生动的分叉正在维护和开发?
  • 有没有好的选择?

据我所知, reportlab更适合创建全新的 pdf(或者我对 reportlab 的经验不足)。

更新:再次维护 PyPDF2 - 我是维护者:-) 我刚刚发布了一个带有几个错误修复的新版本。


维护的三个潜在替代方案(就像 PyPDF2 一样):

我不会使用:

  • PyPDF3 ( pypi ):与 PyPDF2 相比,活动更少,功能可能更少。
  • PyPDF4 ( pypi ):2018 年 PyPI 上的最后一个版本

PyMuPDF是一个用于 MuPDF 的 Python 绑定——一个轻量级的 PDF 和 XPS 查看器 因为 MuPDF 不仅支持 PDF 还支持 XPS、OpenXPS、CBZ、CBR、FB2 和 EPUB 格式,所以 PyMuPDF 也支持。 PyMuPDF 托管在GitHub上。 我们也在PyPI上注册。

它的性能统计数据也非常有希望。 以下是处理性能不同方面的三个部分:

  • 文档解析
  • 文本提取
  • 图像渲染

PyMuPDF 比 pdfrw、PyPDF2 和 pdftk 更快。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM