繁体   English   中英

Python pdf2image 转换为路径无法使用 sftp

[英]Python pdf2image convert to path not working using sftp

我想将扫描 pdf 转换为 OCR pdf,如果文件在本地目录中,我的代码可以工作,但如果我使用 SFTP,就会出现问题。 当我使用 sftp 使用 convert_from_path 时,在使用 sftp 读取文件路径时error expected str, bytes or os.PathLike object, not SFTPFile

如何在 pdf2image convert_to_path 中读取 SFTP 文件路径?

这是我的代码:

for path in sftp.listdir_attr(file_path):
        file = file_path + path.filename
        f_name = path.filename
        with sftp.open(file) as my_file:
                print(my_file)
                pages = convert_from_path(my_file, 200)

sftpfile路径output应该是这样的,不是pathlib.path:

<paramiko.sftp_file.SFTPFile object at 0x7fa22ed55250>
<paramiko.sftp_file.SFTPFile object at 0x7fa22ed55160>

错误:TypeError: expected str, bytes or os.PathLike object, not SFTPFile

我不知道pdf2image。 但是convert_from_path似乎不支持类似文件的对象。

所以要么你需要使用不同的pdf2image API(如果有的话)。

或者你将不得不求助于

  • 将 SFTP 文件下载到临时本地文件并读取该文件。

  • 或者下载SFTP文件到memory:

     flo = BytesIO() sftp.getfo(file, flo) flo.seek(0) convert_from_path(flo.read(), 200)

    请注意,以上是天真的内存效率低下的解决方案。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM