[英]Python pdf2image convert to path not working using sftp
我想将扫描 pdf 转换为 OCR pdf,如果文件在本地目录中,我的代码可以工作,但如果我使用 SFTP,就会出现问题。 当我使用 sftp 使用 convert_from_path 时,在使用 sftp 读取文件路径时error expected str, bytes or os.PathLike object, not SFTPFile
。
如何在 pdf2image convert_to_path 中读取 SFTP 文件路径?
这是我的代码:
for path in sftp.listdir_attr(file_path):
file = file_path + path.filename
f_name = path.filename
with sftp.open(file) as my_file:
print(my_file)
pages = convert_from_path(my_file, 200)
sftpfile路径output应该是这样的,不是pathlib.path:
<paramiko.sftp_file.SFTPFile object at 0x7fa22ed55250>
<paramiko.sftp_file.SFTPFile object at 0x7fa22ed55160>
错误:TypeError: expected str, bytes or os.PathLike object, not SFTPFile
我不知道pdf2image。 但是convert_from_path
似乎不支持类似文件的对象。
所以要么你需要使用不同的pdf2image API(如果有的话)。
或者你将不得不求助于
将 SFTP 文件下载到临时本地文件并读取该文件。
或者下载SFTP文件到memory:
flo = BytesIO() sftp.getfo(file, flo) flo.seek(0) convert_from_path(flo.read(), 200)
请注意,以上是天真的内存效率低下的解决方案。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.