簡體   English   中英

如何使用C#將html文本轉換為utf-8

[英]How can I convert a html text to utf-8 with C#

如何轉換輸入值

現在是本周末舉行活動的時間。 瀏覽並查看您周圍正在發生的事件。 玩得開心! LoudNProudLive系列:“ Hit Makers”特別版LoudNProudLive系列推出“ Hit Makers”特別版,其中包括Tolu(Project Fame),Simi和Oyinkanade。 日期:2015年4月30日,星期四時間:晚上8點地點:ELIAS(海洋灣購物中心),[…]

utf-8中易於閱讀的句子。 我嘗試了下面的代碼,這就是我得到的。 -

現在是本周末活動的時間。 瀏覽並查看您周圍正在發生的事件。 玩得開心! LoudNProudLive系列:``命中注定者''特別版LoudNProudLive系列提出了``命中注定者''特別版,其中包括Tolu(項目成名),Simi和Oyinkanade。 日期:2015年4月30日,星期四時間:晚上8點地點:ELIAS(海洋灣購物中心),[…]

 //convert html to utf-8
    private static string cleanUpCodes(string value)
    {
        //convert from iso to utf-8
        Encoding iso = Encoding.GetEncoding("windows-1252");
        Encoding utf8 = Encoding.UTF8;
        byte[] isoBytes = iso.GetBytes(value);
        byte[] utf8Bytes = Encoding.Convert(utf8, iso, isoBytes);
        string msg = utf8.GetString(utf8Bytes);

        //convert to real html
        msg = HttpUtility.HtmlDecode(msg);

        return msg;
    }

大概這是使用錯誤的編碼解碼的,因此文本很奇怪。 在這種情況下,您不想在各種編碼之間進行Convert ,而只想找回字節並再進行一次轉換:

例如:

var bytes = Encoding.Default.GetBytes(value);
var result = Encoding.UTF8.GetString(bytes);

這樣就可以了,這非常接近:

該周末舉行活動了。 瀏覽並查看您周圍正在發生的事件。 玩得開心! LoudNProudLive系列:“命中注定者”特別版LoudNProudLive系列提出了“命中注定者”特別版,其中包括Tolu(Project Fame),Simi和Oyinkanade。 日期:2015年4月30日星期四時間:晚上8點地點:ELIAS(海洋灣購物中心),[ ]

不過,我傾向於探究問題的根源-您是怎么得到這個字符串的?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM