簡體   English   中英

python/pyspark - 從 csv 讀取特殊字符並將其寫回文件

[英]python/pyspark - Reading special characters from csv and writing it back to the file

我正在閱讀一個 csv 文件,其中的一些值列在這樣的列中 -

MÉXICO
ATLÁNTICO

我正在使用 encoding = 'utf8' 讀取文件,但是在處理值發生如下變化之后

M�XICO
ATL�NTICO

我該怎么做才能保留輸入文件中的原始值。

編輯 - 也嘗試過 utf-16 和 ISO-8859-1。 但也無濟於事。

您的輸入文件可能不是 utf8 編碼。 您可以在讀取文件之前轉換為 utf8。 那應該可以解決您的問題。

這是將 CSV 從非 utf8 編碼轉換為 utf8 編碼的堆棧溢出鏈接

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM