繁体   English   中英

如何将交互式“目录”添加到扫描的pdf中?

[英]How can I add an interactive “table of contents” to a scanned pdf?

我正在尝试从纸质文档过渡到带有目录的可搜索pdf。

有时您会下载pdf书籍或文档(例如,可以在下面看到的Intel手册)。该文档是可搜索的,并且还具有目录。 现在,当您将同一文档放在Google云端硬盘上,然后在ipad上使用PDF Expert打开该文档时,仍然可以通过目录对其进行搜索。 这就是我想对所有扫描的pdf进行的处理。 在此处输入图片说明在此处输入图片说明

现在是一个更具体的例子。 下面显示的是我使用Fujitsu ScanSnap扫描过的文档。 由于ScanSnap随附了某些软件,因此也可以搜索。 因此,现在我有了一个可搜索的pdf,可以在本地或在ipad上打开它,但是它没有目录。 所以我的主要问题是:如何将目录(如《英特尔手册》中的内容)添加到扫描的pdf中 在此处输入图片说明在此处输入图片说明

似乎有很多人使用“目录”来做不同的事情。 就像正在设计文档的人一样,使用InDesign。 我认为我要做的事情必须比这简单。 我认为必须使用Adobe Acrobat Pro这样简单的方法? 关于在现有目录中添加“书签”或“链接”或“标签”的内容。 您是否知道使用acrobat或某些其他软件的简洁明了的方法?

谢谢您的帮助

我之前通过组合多个“小册子”来做到这一点。 每个“章节”都是Adobe Acrobat Pro中合并的一系列页面。 我将章节合并到单独的“小册子”中,然后将它们命名为章节名称,然后将所有章节合并到新的小册子中。

Jpdfbookmark可以用于扫描的书

观看教学影片≫

步骤1:准备目录

使用以下格式将目录保存为.txt文件:

Chapter 1. The Beginning/23
    Para 1.1 Child of The Beginning/25,FitWidth,96
        Para 1.1.1 Child of Child of The Beginning/26,FitHeight,43
Chapter 2. The Continue/30,TopLeft,120,42
    Para 2.1 Child of The Beginning/32,FitPage

您可以对TOC进行ORC,并使用正则表达式对其进行修复。

步骤2:加载该目录

步骤3:为步骤4做准备

这听起来很愚蠢,但是如果您错过了它,您将感到沮丧,必须重新做一次。 展开所有书签( Ctrl + E ),选择所有书签,然后转到“工具”→“应用页面偏移”

步骤4:套用页面偏移

这一步应该是不言自明的。 不要忘记保存。


而已。 大功告成 有关更多信息,您可以阅读其手册 该程序具有命令行模式,可以在Linux,Mac上运行。

如果有非罗马字符,在转储和应用书签时请确保使用相同的编码。

我也有处理扫描书籍的完整指南,您可能想看看: 处理扫描书籍的终极指南


供参考:
如何将目录的OCR转换为适当的输出?
如何在一次通过中将双页扫描的PDF分成两半?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM