[英]How can I convert a html text to utf-8 with C#
如何轉換輸入值
現在是本周末舉行活動的時間。 瀏覽並查看您周圍正在發生的事件。 玩得開心! LoudNProudLive系列:“ Hit Makers”特別版LoudNProudLive系列推出“ Hit Makers”特別版,其中包括Tolu(Project Fame),Simi和Oyinkanade。 日期:2015年4月30日,星期四時間:晚上8點地點:ELIAS(海洋灣購物中心),[…]
utf-8中易於閱讀的句子。 我嘗試了下面的代碼,這就是我得到的。 -
現在是本周末活動的時間。 瀏覽並查看您周圍正在發生的事件。 玩得開心! LoudNProudLive系列:``命中注定者''特別版LoudNProudLive系列提出了``命中注定者''特別版,其中包括Tolu(項目成名),Simi和Oyinkanade。 日期:2015年4月30日,星期四時間:晚上8點地點:ELIAS(海洋灣購物中心),[…]
//convert html to utf-8
private static string cleanUpCodes(string value)
{
//convert from iso to utf-8
Encoding iso = Encoding.GetEncoding("windows-1252");
Encoding utf8 = Encoding.UTF8;
byte[] isoBytes = iso.GetBytes(value);
byte[] utf8Bytes = Encoding.Convert(utf8, iso, isoBytes);
string msg = utf8.GetString(utf8Bytes);
//convert to real html
msg = HttpUtility.HtmlDecode(msg);
return msg;
}
大概這是使用錯誤的編碼解碼的,因此文本很奇怪。 在這種情況下,您不想在各種編碼之間進行Convert
,而只想找回字節並再進行一次轉換:
例如:
var bytes = Encoding.Default.GetBytes(value);
var result = Encoding.UTF8.GetString(bytes);
這樣就可以了,這非常接近:
該周末舉行活動了。 瀏覽並查看您周圍正在發生的事件。 玩得開心! LoudNProudLive系列:“命中注定者”特別版LoudNProudLive系列提出了“命中注定者”特別版,其中包括Tolu(Project Fame),Simi和Oyinkanade。 日期:2015年4月30日星期四時間:晚上8點地點:ELIAS(海洋灣購物中心),[ ]
不過,我傾向於探究問題的根源-您是怎么得到這個字符串的?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.