繁体   English   中英

Adobe Acrobat 如何在合并 PDF 文件方面做得如此出色?

[英]How can Adobe Acrobat do a such a good job at merging PDF files?

在我的工作中,我经常发现自己在批量合并多个 A4 事件票 PDF。 对于下一个示例,我想批量合并 500 个 2Mb 的 pdf。

问题是,无论我使用什么工具(PDFtk、GhostScript、PDFSam、..),生成的 PDF 大约为 1Gb。 如果我用 Acrobat Pro(试用版)做同样的工作,output 是 8Mb,没有任何质量损失。

Acrobat 怎么能做得这么好? 我怎样才能复制这种行为? 这是否与 pdf 都在相同的布局中具有相同的图像并且唯一的变量是文本这一事实有关? (座位和行的详细信息等)

我希望能够使用开源工具在 Linux 环境中执行此操作,我什至尝试构建一个 Python 脚本来使用 PyPDF2 库执行此操作,但除了大尺寸之外,我还丢失了一些文本细节被空白方块替换。

我已经做了几天了,有人知道如何复制 Acrobat 的工作吗?

提前致谢

通过发现常见结构(图像、字体)等的重复。特别是如果您的 500 个文件来自一个共同的来源,正如您所建议的那样。

尝试...

cpdf in1.pdf in2.pdf in3.pdf etc... -o out.pdf

如果结果仍然很大,您可以显式执行以下操作:

cpdf -squeeze out.pdf -o small.pdf

(Cpdf 可免费用于非商业用途,但只有其核心 CamlPDF 是完全开源的。)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM