[英]python/pyspark - Reading special characters from csv and writing it back to the file
我正在閱讀一個 csv 文件,其中的一些值列在這樣的列中 -
MÉXICO
ATLÁNTICO
我正在使用 encoding = 'utf8' 讀取文件,但是在處理值發生如下變化之后
M�XICO
ATL�NTICO
我該怎么做才能保留輸入文件中的原始值。
編輯 - 也嘗試過 utf-16 和 ISO-8859-1。 但也無濟於事。
您的輸入文件可能不是 utf8 編碼。 您可以在讀取文件之前轉換為 utf8。 那應該可以解決您的問題。
這是將 CSV 從非 utf8 編碼轉換為 utf8 編碼的堆棧溢出鏈接。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.