簡體   English   中英

Python BeautifulSoup或CSV編碼問題

[英]Python BeautifulSoup or CSV encoding issue with &nbsp

我一直在尋找將HTML表轉換為CSV格式的方法,並遇到了以下內容,這看起來很有希望(因為我也在嘗試學習Python) https://stackoverflow.com/a/16697784/838253

不幸的是,它不適用於我的樣本,並且遇到錯誤

UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 753: ordinal not in range(128)

這似乎是BeautifulSoup stripped_strings轉換不間斷空格的結果  轉換為u'\\xa0'看起來就像是完全正常的Unicode(盡管將多個 轉換為單個`u'\\ xa0'似乎有些偏離)

該錯誤似乎來自csv模塊。 為什么它不能處理標准Unicode?處理此問題的最佳方法是什么?

在Python 2.7中, csv模塊不支持unicode,請參閱文檔開頭的注釋。

您可以使用示例中的 UnicodeWriter來使用Unicode寫入csv數據。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM