使用wget -c功能在Python中使用urllib下載文件

Question

我正在使用Python編程軟件以從數據庫下載HTTP PDF。 有時下載會停止並顯示以下消息：

retrieval incomplete: got only 3617232 out of 10689634 bytes

如何使用206 Partial Content HTTP功能要求下載重新啟動？

我可以使用wget -c來做它並且它工作得很好，但我想直接在我的Python軟件中實現它。

任何的想法？

謝謝

Answer 1

您可以通過發送帶有Range標頭的GET來請求部分下載：

import urllib2
req = urllib2.Request('http://www.python.org/')
#
# Here we request that bytes 18000--19000 be downloaded.
# The range is inclusive, and starts at 0.
#
req.headers['Range'] = 'bytes=%s-%s' % (18000, 19000)
f = urllib2.urlopen(req)
# This shows you the *actual* bytes that have been downloaded.
range=f.headers.get('Content-Range')
print(range)
# bytes 18000-18030/18031
print(repr(f.read()))
# '  </div>\n</body>\n</html>\n\n\n\n\n\n\n'

請注意檢查Content-Range以了解實際下載的字節數，因為您的范圍可能超出范圍，並且/或者並非所有服務器都看起來都遵循Range標頭。

使用wget -c功能在Python中使用urllib下載文件

問題描述

1 個解決方案

解決方案1
7 已采納 2010-01-07 15:53:27

使用wget -c功能在Python中使用urllib下載文件

問題描述

1 個解決方案

解決方案1 7 已采納 2010-01-07 15:53:27

解決方案1
7 已采納 2010-01-07 15:53:27