簡體   English   中英

從字符串中刪除HTML

[英]Remove HTML from string

我試圖從我的RSS源清除HTML編碼。 我無法弄清楚如何設置以下來取出HTML編碼。

var rssFeed = XElement.Parse(e.Result);

var currentFeed = this.DataContext as app.ViewModels.FeedViewModel;
var items = from item in rssFeed.Descendants("item")                            
            select new ATP_Tennis_App.ViewModels.FeedItemViewModel()
            {

                Title = item.Element("title").Value,
                DatePublished = DateTime.Parse(item.Element("pubDate").Value),
                Url = item.Element("link").Value,
                Description = item.Element("description").Value
            };

foreach (var item in items)
    currentFeed.Items.Add(item);

只需使用以下代碼:

var withHtml = "<p>hello <b>there</b></p>";
var withoutHtml = Regex.Replace(withHtml, "<.+?>", string.Empty);

這將清除html只留下文本,所以“你好那里”

所以,你可以復制並使用這個功能:

string RemoveHtmlTags(string html) {
    return Regex.Replace(html, "<.+?>", string.Empty);
}

您的代碼看起來像這樣:

var rssFeed = XElement.Parse(e.Result);
var currentFeed = this.DataContext as app.ViewModels.FeedViewModel;
var items = from item in rssFeed.Descendants("item")                            
            select new ATP_Tennis_App.ViewModels.FeedItemViewModel()
            {

                Title = RemoveHtmlTags(item.Element("title").Value),
                DatePublished = DateTime.Parse(item.Element("pubDate").Value),
                Url = item.Element("link").Value,
                Description = RemoveHtml(item.Element("description").Value)
            };

您可以使用此代碼示例,它可以正常使用

public static string RemoveHTMLTags(string value)
    {
        string step1 = Regex.Replace(value, "<[^>]*>", " ");
        string step2 = HttpUtility.HtmlDecode(step1);
        return step2;
    }

我希望,這段代碼可以幫到你。

使用以下類實用程序:

HttpUtility.HtmlDecode(string);

請不要再提這個答案了。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM