![](/img/trans.png)
[英]'utf-8' codec can't decode byte 0x8b in position 0: invalid start byte django
[英]'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
我正在嘗試通過以下代碼讀取 web 頁面的頁面源:
from urllib.request import urlopen
url = "http://www.tsetmc.com/Loader.aspx?ParTree=15"
page = urlopen(url)
htmlSource = page.read().decode("utf-8")
f=open("output.txt",'w')
f.write(htmlSource)
但我得到了這個錯誤:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
我不知道這個頁面是否用 utf-8 編碼。
謝謝你的幫助。
我不知道這個頁面是否用 utf-8 編碼。
如果您不知道頁面是如何編碼的,您可以將字節寫入文件而不嘗試檢查它們:
page = urlopen(url)
htmlSource = page.read()
f=open("output.txt",'wb')
f.write(htmlSource)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.