簡體   English   中英

Python 字符串無法識別特殊字符

[英]Python string not recognize special characters

我有一個 csv 帶有一系列帶有特殊字符的字符串,當它加載時看起來很好(使用df.head(10)但是當我使用df.iloc[0].descripcion獲得單元格時出現一些編碼。

我看到這個: depto. interior de 80.15m2, consta de sala comedor cocina equipada, \xc3\xa1rea de lavado, ba\xc3\xb1o completo, recamara principal con closet y ba\xc3\xb1o completo. 2da. recamara con closet.' depto. interior de 80.15m2, consta de sala comedor cocina equipada, \xc3\xa1rea de lavado, ba\xc3\xb1o completo, recamara principal con closet y ba\xc3\xb1o completo. 2da. recamara con closet.'

我需要將其更改為這樣的內容: depto. interior de 80.15m2, consta de sala comedor cocina equipada, área de lavado, baño completo, recamara principal con closet y baño completo. 2da. recamara con closet. depto. interior de 80.15m2, consta de sala comedor cocina equipada, área de lavado, baño completo, recamara principal con closet y baño completo. 2da. recamara con closet.

加載 csv 我正在使用 pandas 和pd.read_csv('../data.csv')

如果我使用 excel 或 libre office 打開文件看起來不錯,所以我認為這是編碼。

這是我最后運行的代碼

stopwords = set(STOPWORDS)
# split the value 
tokens = df2.iloc[0].descripcion.split(' ')

# Converts each token into lowercase 
for i in range(len(tokens)): 
   tokens[i] = tokens[i].lower() 

comment_words += " ".join(tokens)+" "
wordcloud = WordCloud(width = 1600, height = 1600, 
               background_color ='white', 
               stopwords = stopwords, 
               min_font_size = 10).generate(comment_words) 
 
# plot the WordCloud image                        
plt.figure(figsize = (8, 8), facecolor = None) 
plt.imshow(wordcloud) 
plt.axis("off") 
plt.tight_layout(pad = 0) 
# plt.savefig('words.png',dpi=)
plt.show() ```

修復了df.read_csv(filename,encoding='utf-8')的組合

並在 wordcloud 實例中添加 arial 的路徑。 (你應該下載並放置正確的路徑)

                background_color ='white', 
                stopwords = stopwords,
                font_path='../data/arial.ttf',
                min_font_size = 10).generate(comment_words) ```

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM