基于PDF标题与PyPDF2将多个PDF合并到单个PDF的特定页面

Question

我有一个 PDF 文件夹，我目前正在使用 PyPDF2 进行合并。

merger = PdfFileMerger()
for file in os.listdir('****'):
        if file.endswith(".pdf"):
            merger.append('****'+file)
merger.write('****' + str(dt.date.today()) + '.pdf')
merger.close()

这些文件包含图表，标题非常具体。 我想做的是：

根据标题中的字符串，将多个 PDF 合并到新 PDF 的同一页面（最好分成两列） - 我知道这不是正确的语法，但类似于：

if 'dogs' in file: 
    merger.write(...,page=1,cols=2) 
elif 'cats' in file: 
    merger.write(...,page=2,cols=2)

不确定这是否可能，查看了其他答案并阅读了文档，但无法弄清楚。 还希望能够在单个页面上拥有相当数量的图表（我猜最多 6 个？）。

Answer 1

如果 PDF 标题始终位于文件中的相同位置，那么您可以执行extractText() function。 检索每个 pdf 文件中的标题文本。 然后进行比较分析。

基于PDF标题与PyPDF2将多个PDF合并到单个PDF的特定页面

问题描述

1 个解决方案

解决方案1
0 2021-03-24 21:28:47

基于PDF标题与PyPDF2将多个PDF合并到单个PDF的特定页面

问题描述

1 个解决方案

解决方案1 0 2021-03-24 21:28:47

解决方案1
0 2021-03-24 21:28:47