[英]How to find the file name for files generated by pdf2image
我正在嘗試將我的pdf
文件轉換為jpg
。 我首先使用 pdf2image 將文件另存為.ppm
。 然后我想使用 PIL 將.ppm
轉換為.jpg
。
如何找到 pdf2image 保存的文件的名稱?
這是我的代碼:
def to_jpg(just_ids):
for just_id in just_ids:
image = convert_from_path('/Users/davidtannenbaum/Desktop/scraped/{}.pdf'.format(just_id), output_folder='/Users/davidtannenbaum/Desktop/scraped/')
file_name = ?
im = Image.open("/Users/davidtannenbaum/Desktop/scraped/{}.ppm".format(file_name))
im.save("/Users/davidtannenbaum/Desktop/scraped/{}.jpg".format(just_id))
你不需要, image
變量應該包含Image
對象的列表。 你可以簡單地做:
for i, im in enumerate(image):
im.save("/Users/davidtannenbaum/Desktop/scraped/{}_{}.jpg".format(just_id, i)))
convert_to_path()
方法還有一些您可以使用的參數。 您可以將paths_only
參數設置為True
並將格式屬性fmt
設置為"jpeg"
。
這將直接將您的圖像以 JPG 格式而不是 PPM 格式保存到輸出文件夾,並且image
變量將包含每個圖像而不是圖像對象的相對路徑。
for just_id in just_ids:
image = convert_from_path('/Users/davidtannenbaum/Desktop/scraped/{}.pdf'.format(just_id), output_folder='/Users/davidtannenbaum/Desktop/scraped/', fmt="jpeg", paths_only=True)
pdf_path = '/path/to/pdf_images/'
output_folder = '/path/for/output/images/'
for pdf in os.listdir(pdf_path):
filename = pdf.split('.')[0] # prepare your filename
pdfs = convert_from_path(os.path.join(pdf_path,pdf),output_folder=output_folder, output_file=os.path.join(output_folder+ filename), fmt="jpeg")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.