[英]PyPDF2 and PyPDF4 fails to extract text from the PDF
import PyPDF4 as p2
pdffile = open("XXXX.pdf","rb")
pdfread=p2.PdfFileReader(pdffile)
print(pdfread.getNumPages())
pageinfo=pdfread.getPage(0)
print(pageinfo.extractText())
在運行上面的第 4 行代碼時,成功返回正確的值,即 no。 PDF 中的頁數,但是,第 6 行(PDF 提取)給出了一頁長的空白數據。 我試過使用 PyPDF2 和 PyPDF4,並在 Python 終端和 sublimetext 中運行了代碼,在這兩種情況下,我都收到了空白頁而不是實際文本。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.