簡體   English   中英

使用Python下載的PDF文件無法在acrobat中打開

[英]PDF files downloaded with Python cannot be opened in acrobat

我有一個小python腳本,我用來下載一大堆PDF文件進行存檔。 我遇到的問題是,當我下載文件時,它們在正確的標題下正確顯示,但是它們的大小錯誤,並且Acrobat無法打開它們,它會因為Out of memory Insufficient data for an imageInsufficient data for an image而出現錯誤消息Insufficient data for an image或其他任意Acrobat錯誤。 在文本編輯器中查看頁面的內容看起來有點像PDF文檔,我的意思是它通常是不可理解的,但有一些文本和標記片段,包括PDF標識符。

下載文件的代碼是這樣的:

def download_file( file_id):
    folder_path = ".\\pdf_files\\"
    file_download="http://myserver/documentimages.asp?SERVICE_ID=RETRIEVE_IMAGE&documentKey="    
    file_content = urllib.urlopen(file_download+file_id, proxies={})
    file_local = open( folder_path + file_id + '.pdf', 'w' )
    file_local.write(file_content.read())
    file_content.close()
    file_local.close()

如果通過瀏覽器下載相同的文件,它看起來很好,但在磁盤上也更大。 我猜這個問題可能與保存文件時的編碼有關?

您需要將其寫為二進制文件,以便:

file_local = open( folder_path + file_id + '.pdf', 'wb' )

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM