繁体   English   中英

如何修复'无法从'pdfminer.pdfinterp'导入名称'process_pdf'错误

[英]How to fix 'cannot import name 'process_pdf' from 'pdfminer.pdfinterp'' error

我正在尝试将pdf文件中的文本转换为文本或HTML格式,但是经常发生此错误“无法从'pdfminer.pdfinterp'导入名称'process_pdf''如何删除此文件?

我已经在Visual Basic Studio中尝试了此代码,但仍然无法正常工作,但是在这种情况下,由于空格而导致缩进错误,因此我在jupyter笔记本中尝试了此错误并得到了此错误。

from io import StringIO
from pdfminer.pdfinterp import PDFResourceManager , process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layput import LAParams



def to_txt(pdf_path):
    input_ = file(pdf_path , 'rb')
    output = StringIO()

    manager = PDFResourceManager()
    converter = TextConverter(manager, output, laparams = LAParams())
    process_pdf(manager, converter, input_)

    return output.getvalue()

b = to_txt(rb"C:\Users\Jasvinder Singh\Desktop\HACK-IN REPORT.docx")

ImportError: cannot import name 'process_pdf' from 'pdfminer.pdfinterp' (C:\Users\Jasvinder Singh\Anaconda3\lib\site-packages\pdfminer\pdfinterp.py)

请参阅文档以及有关错误的注释

process_pdf方法已由PDFPage.get_pages()取代。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM