簡體   English   中英

將文件寫入csv時出現解碼問題

[英]decoding issue when writing a file to csv

使用以下代碼,我嘗試從具有特殊字符的url中提取描述。

from bs4 import BeautifulSoup
import urllib.request
import pandas as pd
html = urllib.request.urlopen('http://uk.rs-online.com/web/p/piezoelectric-
miniature-speakers/7868948/').read()
soup = BeautifulSoup(html)
description = soup.find(itemprop="name").string.strip()
description
pd.DataFrame([description]).to_csv('file.csv')

查看csv文件中的抓取數據后,我發現那些特殊字符已替換為問號。

如何在csv文件中獲取那些特殊字符。

預先感謝您的建議。

選擇正確的編碼,特殊字符將出現在文件中。 我使用utf8進行了測試,並且所有特殊字符均正確顯示。

from bs4 import BeautifulSoup
import urllib.request
import pandas as pd
html = urllib.request.urlopen('http://uk.rs-online.com/web/p/piezoelectric-miniature-speakers/7868948/').read()
soup = BeautifulSoup(html)
description = soup.find(itemprop="name").string.strip()
pd.DataFrame([description]).to_csv('file.csv', encoding='utf8')

還要確保在編輯器中以正確的編碼打開文件

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM