繁体   English   中英

基于PDF标题与PyPDF2将多个PDF合并到单个PDF的特定页面

[英]Merge multiple PDFs to specific pages of single PDF based on PDF titles with PyPDF2

我有一个 PDF 文件夹,我目前正在使用 PyPDF2 进行合并。

merger = PdfFileMerger()
for file in os.listdir('****'):
        if file.endswith(".pdf"):
            merger.append('****'+file)
merger.write('****' + str(dt.date.today()) + '.pdf')
merger.close()

这些文件包含图表,标题非常具体。 我想做的是:

根据标题中的字符串,将多个 PDF 合并到新 PDF 的同一页面(最好分成两列) - 我知道这不是正确的语法,但类似于:

if 'dogs' in file: 
    merger.write(...,page=1,cols=2) 
elif 'cats' in file: 
    merger.write(...,page=2,cols=2)

不确定这是否可能,查看了其他答案并阅读了文档,但无法弄清楚。 还希望能够在单个页面上拥有相当数量的图表(我猜最多 6 个?)。

如果 PDF 标题始终位于文件中的相同位置,那么您可以执行extractText() function。 检索每个 pdf 文件中的标题文本。 然后进行比较分析。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM