![](/img/trans.png)
[英]Recursively merge pdf's in subfolders using the pyPDF2 module in python
[英]python pdf (PyPDF2 module) - How to split/merge this?
我试图拆分和合并pdf文件,以便我可以删除每个pdf文件的第一页。这是代码。
#python3
#split and merge pdf files!
import os, PyPDF2
pdfFiles = []
os.chdir('C:\\Users\\Cyber\\Downloads\\5-111-fall-2008\\5-111-fall-2008\\contents\\readings-and-lecture-notes')
for filename in os.listdir('.'):
if filename.endswith('pdf'):
pdfFiles.append(filename)
pdfWriter = PyPDF2.PdfFileWriter()
for filename in pdfFiles:
pdfFileObj = open(filename, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
for pageNum in range(1, pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open('Merged.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()
然后我得到以下错误...
:PdfReadWarning:外部参照表未为零索引。 对象的ID号将被更正。 [pdf.py:1736]
我搜索了该错误,发现它表明PDF本身的创建可能存在问题。
尽管我按需要获取了merged.pdf文件,但我想知道这到底意味着什么以及如何避免获取它们。
此警告意味着外部参照表的第一部分不是以对象零开始。 编写PDF可能存在错误。 如果strict = False,PyPDF2将尝试更正对象ID号。 如果strict = True,则不会更正。默认值为True。 试试PyPDF2.PdfFileReader(pdfFileObj,False)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.