使用Python下載的PDF文件無法在acrobat中打開

Question

我有一個小python腳本，我用來下載一大堆PDF文件進行存檔。 我遇到的問題是，當我下載文件時，它們在正確的標題下正確顯示，但是它們的大小錯誤，並且Acrobat無法打開它們，它會因為Out of memory Insufficient data for an image或Insufficient data for an image而出現錯誤消息Insufficient data for an image或其他任意Acrobat錯誤。 在文本編輯器中查看頁面的內容看起來有點像PDF文檔，我的意思是它通常是不可理解的，但有一些文本和標記片段，包括PDF標識符。

下載文件的代碼是這樣的：

def download_file( file_id):
    folder_path = ".\\pdf_files\\"
    file_download="http://myserver/documentimages.asp?SERVICE_ID=RETRIEVE_IMAGE&documentKey="    
    file_content = urllib.urlopen(file_download+file_id, proxies={})
    file_local = open( folder_path + file_id + '.pdf', 'w' )
    file_local.write(file_content.read())
    file_content.close()
    file_local.close()

如果通過瀏覽器下載相同的文件，它看起來很好，但在磁盤上也更大。 我猜這個問題可能與保存文件時的編碼有關？

Answer 1

您需要將其寫為二進制文件，以便：

file_local = open( folder_path + file_id + '.pdf', 'wb' )

使用Python下載的PDF文件無法在acrobat中打開

問題描述

1 個解決方案

解決方案1
4 已采納 2012-06-20 15:16:23

使用Python下載的PDF文件無法在acrobat中打開

問題描述

1 個解決方案

解決方案1 4 已采納 2012-06-20 15:16:23

解決方案1
4 已采納 2012-06-20 15:16:23