簡體   English   中英

R中的UTF-8文件編碼

[英]UTF-8 file encoding in R

我有一個.csv文件,它應該是 'UTF-8' 編碼。 我已從 Sql Server Management Studio 導出它。 但是,當將其導入R它在ÿ行上失敗。 我使用 read.csv2 並指定文件編碼“UTF-8-BOM”。

Notepad++正確顯示ÿ並說它是 UTF-8 編碼。 這是R編碼的錯誤,還是ÿ實際上不是 UTF-8 編碼方案的一部分?

我上傳了一個小tab delimited .txt文件,但在這里失敗了: https : //www.dropbox.com/s/i2d5yj8sv299bsu/TestData.txt

謝謝

這可能是開頭的 BOM 標記的一部分。 如果編輯器或解析器不能識別 BOM 標記,它就會認為它是垃圾。 有關更多詳細信息,請參閱https://www.ultraedit.com/support/tutorials-power-tips/ultraedit/unicode.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM