簡體   English   中英

使用C#從HTML中獲取標記?

[英]Get tag out of html with C#?

我有這個html標簽:

<img src="/Student/ExaminationImage?name=figuur" />

我想將其剝離為:/ Student / ExaminationImage?name = figuur和第二個字符串為:figuur

我該怎么做呢?

我嘗試了一切,但沒有任何效果。

格茨

HTML Agility Pack是解析HTML的好工具。

如果總是格式正確的XML,則可以始終使用linq到xml

string imageTag = "<img src=\"\/Student\/ExaminationImage?name=figuur\" />"

string src = XElement.Parse(imageTag ).Attribute("src").Value;

擴展@Albin的答案:

HTML Agility Pack是一種非常健壯,可靠的方法來處理此問題,而且確實是可行的方法。

但是, 當且僅當您可以保證標簽是a)已經隔離在字符串中,並且b)始終與您描述的格式相同時,才可以使用此標簽:

    static void Main(string[] args)
    {
        var tag = @"<img src=""/Student/ExaminationImage?name=figuur"" />";

        Console.WriteLine("Tag: {0}", tag);

        var tagParts = tag.Split(new[] {'"'},StringSplitOptions.RemoveEmptyEntries);

        var src = tagParts[1];

        Console.WriteLine("Src: {0}", src);

        var srcParts = src.Split('?');

        Console.WriteLine("Parameters: {0}", srcParts[1]);

        Console.ReadLine();
    }

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM