[英]how to open pdf file using pypdf2
我尝试在 Google Colab 中使用pypdf
打开一个 pdf 文件
import PyPDF2 as pdf2
with open("sample.pdf", "r+") as f:
pdf = pdf2.PdfFileReader(f)
但我收到以下错误:
UnsupportedOperation: can't do nonzero end-relative seeks
将模式形式“r”更改为“r+”并不能解决问题。 这个错误的原因是什么,我该如何解决?
根据此错误报告,您需要使用mode='rb'
打开。
import PyPDF2 as pdf2
with open ("sample.pdf", "rb") as f:
pdf = pdf2.PdfFileReader(f)
打开 pdf 文件并打印其第一页的简单程序如下所示,
import PyPDF2
pdfFileObj = open('example.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages) # printing number of pages in pdf
pageObj = pdfReader.getPage(0)
print(pageObj.extractText()) # extracting text from page 0
pdfFileObj.close()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.