[英]How to find the file name for files generated by pdf2image
我正在尝试将我的pdf
文件转换为jpg
。 我首先使用 pdf2image 将文件另存为.ppm
。 然后我想使用 PIL 将.ppm
转换为.jpg
。
如何找到 pdf2image 保存的文件的名称?
这是我的代码:
def to_jpg(just_ids):
for just_id in just_ids:
image = convert_from_path('/Users/davidtannenbaum/Desktop/scraped/{}.pdf'.format(just_id), output_folder='/Users/davidtannenbaum/Desktop/scraped/')
file_name = ?
im = Image.open("/Users/davidtannenbaum/Desktop/scraped/{}.ppm".format(file_name))
im.save("/Users/davidtannenbaum/Desktop/scraped/{}.jpg".format(just_id))
你不需要, image
变量应该包含Image
对象的列表。 你可以简单地做:
for i, im in enumerate(image):
im.save("/Users/davidtannenbaum/Desktop/scraped/{}_{}.jpg".format(just_id, i)))
convert_to_path()
方法还有一些您可以使用的参数。 您可以将paths_only
参数设置为True
并将格式属性fmt
设置为"jpeg"
。
这将直接将您的图像以 JPG 格式而不是 PPM 格式保存到输出文件夹,并且image
变量将包含每个图像而不是图像对象的相对路径。
for just_id in just_ids:
image = convert_from_path('/Users/davidtannenbaum/Desktop/scraped/{}.pdf'.format(just_id), output_folder='/Users/davidtannenbaum/Desktop/scraped/', fmt="jpeg", paths_only=True)
pdf_path = '/path/to/pdf_images/'
output_folder = '/path/for/output/images/'
for pdf in os.listdir(pdf_path):
filename = pdf.split('.')[0] # prepare your filename
pdfs = convert_from_path(os.path.join(pdf_path,pdf),output_folder=output_folder, output_file=os.path.join(output_folder+ filename), fmt="jpeg")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.