簡體   English   中英

如何確定CSV文件是否為unicode

[英]How to determine if a CSV file is unicode or not

我正在使用C#,我有一個用逗號分隔的csv文件,其中使用不同語言的不同字符串。 如果我的應用是unicode,則應僅打開CSV。

有沒有一種簡單的方法可以在代碼中確定這一點?

當您說“ Unicode”時,我假設您的意思是UTF-8。 Unicode不是編碼,文件不能是“ Unicode”。

您可以使用一個庫,例如ude是一個C#庫,它試圖確定文件使用什么編碼。 它使用此處描述的算法。 它不是100%可靠的。

CSV規范沒有提供提供描述編碼格式的元數據的方法。 規范本身使用ASCII編碼作為分隔符。 但是分隔符之間的數據令牌可以是任何東西。

您將必須通讀數據本身,並據此推斷編碼類型。

如果您控制輸出和輸入,則可以通過添加自己的元數據來修改其格式以適合自己的需求,但是如果這對您來說很重要,那么它就不適合CSV文件格式。

因此,沒有確定編碼的“簡便”方法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM