[英]Get tag out of html with C#?
我有這個html標簽:
<img src="/Student/ExaminationImage?name=figuur" />
我想將其剝離為:/ Student / ExaminationImage?name = figuur和第二個字符串為:figuur
我該怎么做呢?
我嘗試了一切,但沒有任何效果。
格茨
HTML Agility Pack是解析HTML的好工具。
如果總是格式正確的XML,則可以始終使用linq到xml
string imageTag = "<img src=\"\/Student\/ExaminationImage?name=figuur\" />"
string src = XElement.Parse(imageTag ).Attribute("src").Value;
擴展@Albin的答案:
HTML Agility Pack是一種非常健壯,可靠的方法來處理此問題,而且確實是可行的方法。
但是, 當且僅當您可以保證標簽是a)已經隔離在字符串中,並且b)始終與您描述的格式相同時,才可以使用此標簽:
static void Main(string[] args)
{
var tag = @"<img src=""/Student/ExaminationImage?name=figuur"" />";
Console.WriteLine("Tag: {0}", tag);
var tagParts = tag.Split(new[] {'"'},StringSplitOptions.RemoveEmptyEntries);
var src = tagParts[1];
Console.WriteLine("Src: {0}", src);
var srcParts = src.Split('?');
Console.WriteLine("Parameters: {0}", srcParts[1]);
Console.ReadLine();
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.