簡體   English   中英

“utf-8”編解碼器無法解碼 position 中的字節 0x8b 1:無效的起始字節

[英]'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

我正在嘗試通過以下代碼讀取 web 頁面的頁面源:

from urllib.request import urlopen

url = "http://www.tsetmc.com/Loader.aspx?ParTree=15"

page = urlopen(url)

htmlSource = page.read().decode("utf-8")

f=open("output.txt",'w')
f.write(htmlSource)

但我得到了這個錯誤:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

我不知道這個頁面是否用 utf-8 編碼。

謝謝你的幫助。

我不知道這個頁面是否用 utf-8 編碼。

如果您不知道頁面是如何編碼的,您可以將字節寫入文件而不嘗試檢查它們:

page = urlopen(url)
htmlSource = page.read()
f=open("output.txt",'wb')
f.write(htmlSource)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM