簡體   English   中英

如何從 C# 中的越南語字符串中刪除 Unicode 符號

[英]How to remove Unicode symbol from Vietnamese string in C#

我正在為我在越南的合作伙伴做一個項目,我必須解決越南語。 如何刪除越南語字符串中的所有 Unicode 符號?

例如:Xin chào các bạn(大家好)--> Xin chao cac ban

您可以定義一個string[] VietnameseSigns包含了所有越南的跡象。

例如:

private static readonly string[] VietnameseSigns = new string[]
        {

            "aAeEoOuUiIdDyY",

            "áàạảãâấầậẩẫăắằặẳẵ",

            "ÁÀẠẢÃÂẤẦẬẨẪĂẮẰẶẲẴ",

            "éèẹẻẽêếềệểễ",

            "ÉÈẸẺẼÊẾỀỆỂỄ",

            "óòọỏõôốồộổỗơớờợởỡ",

            "ÓÒỌỎÕÔỐỒỘỔỖƠỚỜỢỞỠ",

            "úùụủũưứừựửữ",

            "ÚÙỤỦŨƯỨỪỰỬỮ",

            "íìịỉĩ",

            "ÍÌỊỈĨ",

            "đ",

            "Đ",

            "ýỳỵỷỹ",

            "ÝỲỴỶỸ"
        };

之后,您定義一個函數以從輸入字符串中刪除所有越南語符號。

例如:

public static string RemoveSign4VietnameseString(string str)
        {
            for (int i = 1; i < VietnameseSigns.Length; i++)
            {
                for (int j = 0; j < VietnameseSigns[i].Length; j++)
                    str = str.Replace(VietnameseSigns[i][j], VietnameseSigns[0][i - 1]);
            }
            return str;
        }

實際上,您可以使用Diacritics package 刪除符號,您可以從我固定它的鏈接中查看它

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM