![](/img/trans.png)
[英]PyPDF2 Splitting a single PDF into multiple PDFs with variable lengths
[英]Merge multiple PDFs to specific pages of single PDF based on PDF titles with PyPDF2
我有一个 PDF 文件夹,我目前正在使用 PyPDF2 进行合并。
merger = PdfFileMerger()
for file in os.listdir('****'):
if file.endswith(".pdf"):
merger.append('****'+file)
merger.write('****' + str(dt.date.today()) + '.pdf')
merger.close()
这些文件包含图表,标题非常具体。 我想做的是:
根据标题中的字符串,将多个 PDF 合并到新 PDF 的同一页面(最好分成两列) - 我知道这不是正确的语法,但类似于:
if 'dogs' in file:
merger.write(...,page=1,cols=2)
elif 'cats' in file:
merger.write(...,page=2,cols=2)
不确定这是否可能,查看了其他答案并阅读了文档,但无法弄清楚。 还希望能够在单个页面上拥有相当数量的图表(我猜最多 6 个?)。
如果 PDF 标题始终位于文件中的相同位置,那么您可以执行extractText()
function。 检索每个 pdf 文件中的标题文本。 然后进行比较分析。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.