簡體   English   中英

C# Tamil Runes:如何獲得正確數量的泰米爾字母

[英]C# Tamil Runes: How to get the correct number of Tamil letters

我試圖弄清楚如何在泰米爾語中處理文件名。 我需要像這樣縮短它們:“foobar.gif”->“foo...gif”。

我今天了解到有些語言使用多個字符來表示一個字母,我發現 C# 有符文概念。

我不能讓它與泰米爾語一起使用。

以“தமிழ்.gif”為例:

我曾希望“தமிழ்.gif”。長度應該是 6,但它是 9:

在此處輸入圖像描述

如何獲得正確的子字符串,例如“தமிழ்.gif”。Substring(2) =>“தமி”而不是“தம”。

我錯過了什么?

這與代理對有關,代理對是在 Unicode 中表示“單個”字符的char對。

請參閱有關代理對的這些問題: 什么是可以處理代理對的 String.IndexOf(string input) 的 Unicode 安全副本?

對於代理對,String.Replace(string,string) Unicode 安全嗎?

在處理實際上比單個字符長的字符時,您必須找到當前字符串數組中包含的字符串數組的索引。

我應該補充一點,因此,您必須創建一些“Unicode 安全”方法來刪除字符或查找索引,否則您最終可能會刪除有效 Unicode 字符的“一半”並留下無效的 Unicode

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM