python pdf（PyPDF2模块）-如何拆分/合并？

Question

我试图拆分和合并pdf文件，以便我可以删除每个pdf文件的第一页。这是代码。

    #python3

    #split and merge pdf files!


    import os, PyPDF2

    pdfFiles = []
    os.chdir('C:\\Users\\Cyber\\Downloads\\5-111-fall-2008\\5-111-fall-2008\\contents\\readings-and-lecture-notes')



    for filename in os.listdir('.'):
        if filename.endswith('pdf'):
            pdfFiles.append(filename)

    pdfWriter = PyPDF2.PdfFileWriter()

    for filename in pdfFiles:
        pdfFileObj = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

        for pageNum in range(1, pdfReader.numPages):
            pageObj = pdfReader.getPage(pageNum)
            pdfWriter.addPage(pageObj)

    pdfOutput = open('Merged.pdf', 'wb')
    pdfWriter.write(pdfOutput)
    pdfOutput.close()

然后我得到以下错误...

：PdfReadWarning：外部参照表未为零索引。 对象的ID号将被更正。 [pdf.py:1736]

我搜索了该错误，发现它表明PDF本身的创建可能存在问题。

尽管我按需要获取了merged.pdf文件，但我想知道这到底意味着什么以及如何避免获取它们。

Answer 1

此警告意味着外部参照表的第一部分不是以对象零开始。 编写PDF可能存在错误。 如果strict = False，PyPDF2将尝试更正对象ID号。 如果strict = True，则不会更正。默认值为True。 试试PyPDF2.PdfFileReader(pdfFileObj,False)

python pdf（PyPDF2模块）-如何拆分/合并？

问题描述

1 个解决方案

解决方案1
1 已采纳 2016-09-03 09:01:32

python pdf（PyPDF2模块）-如何拆分/合并？

问题描述

1 个解决方案

解决方案1 1 已采纳 2016-09-03 09:01:32

解决方案1
1 已采纳 2016-09-03 09:01:32