繁体   English   中英

python pdf(PyPDF2模块)-如何拆分/合并?

[英]python pdf (PyPDF2 module) - How to split/merge this?

我试图拆分和合并pdf文件,以便我可以删除每个pdf文件的第一页。这是代码。

    #python3

    #split and merge pdf files!


    import os, PyPDF2

    pdfFiles = []
    os.chdir('C:\\Users\\Cyber\\Downloads\\5-111-fall-2008\\5-111-fall-2008\\contents\\readings-and-lecture-notes')



    for filename in os.listdir('.'):
        if filename.endswith('pdf'):
            pdfFiles.append(filename)

    pdfWriter = PyPDF2.PdfFileWriter()

    for filename in pdfFiles:
        pdfFileObj = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

        for pageNum in range(1, pdfReader.numPages):
            pageObj = pdfReader.getPage(pageNum)
            pdfWriter.addPage(pageObj)

    pdfOutput = open('Merged.pdf', 'wb')
    pdfWriter.write(pdfOutput)
    pdfOutput.close()

然后我得到以下错误...

:PdfReadWarning:外部参照表未为零索引。 对象的ID号将被更正。 [pdf.py:1736]

我搜索了该错误,发现它表明PDF本身的创建可能存在问题。

尽管我按需要获取了merged.pdf文件,但我想知道这到底意味着什么以及如何避免获取它们。

此警告意味着外部参照表的第一部分不是以对象零开始。 编写PDF可能存在错误。 如果strict = False,PyPDF2将尝试更正对象ID号。 如果strict = True,则不会更正。默认值为True。 试试PyPDF2.PdfFileReader(pdfFileObj,False)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM