繁体 English 中英

extractText() 函数不返回文本

[英]The extractText() fucntion does not return text

原文 2020-01-26 15:14:44 4 1 python/ python-3.x/ pypdf2

pdfFileObject = open('MDD.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObject)
count = pdfReader.numPages
for i in range(count):
    page = pdfReader.getPage(i)
    print(page.extractText()

以上是我的代码，当我运行脚本时，它只输出一堆数字和数字，而不是文件的文本。 有人可以帮我吗？

1 个解决方案

此功能不适用于所有 PDF 文件。 这在文档中有解释：

这对某些 PDF 文件效果很好，但对其他文件效果不佳，具体取决于所使用的生成器。 这将在未来细化。 不要依赖于这个函数的文本顺序，因为如果这个函数变得更复杂，它会改变。 :return: 一个 unicode 字符串对象。

在这个文件上试试你的代码。 我确定它应该可以工作，所以问题似乎不在您的代码中。

如果您确实需要解析以与原始 MDD.pdf 相同的方式创建的文件，则必须选择另一个库。

Python 为什么函数返回 None 而不是 False

[英]Python Why does the fucntion return None instead of False

Python PyPDF - 使用 ExtractText 阅读文本时获取额外的空格

[英]Python PyPDF - getting additional spaces when reading text using ExtractText

从功能返回值到特征GUI

[英]Return value From Fucntion to Traits GUI

scrapy不返回文本

[英]scrapy does not return text

将函数用作函数中的参数，该函数旨在在无法返回的线程中运行

[英]Using a fucntion as a parameter in a function that is meant to be run in a thread cant return

QInputDialog不只返回文本

[英]QInputDialog does not return just text

为什么return语句不返回任何文本，而print呢？

[英]Why does the return statement not return any text, whilst print does?

Python - pypdf2 extractText() 不工作

[英]Python - pypdf2 extractText() not working

为什么“危险”模块返回已签名的文本？

[英]Why does 'itsdangerous' module return the signed text?

为什么selenium返回一个空文本字段？

[英]Why does selenium return an empty text field?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Python 为什么函数返回 None 而不是 False Python PyPDF - 使用 ExtractText 阅读文本时获取额外的空格从功能返回值到特征GUI scrapy不返回文本将函数用作函数中的参数，该函数旨在在无法返回的线程中运行 QInputDialog不只返回文本为什么return语句不返回任何文本，而print呢？ Python - pypdf2 extractText() 不工作为什么“危险”模块返回已签名的文本？为什么selenium返回一个空文本字段？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM