[英]Retrieve all the ids for a given sentence using regex in c#
我正在使用.Net(C#)软件来获取和处理html文件。 我需要从该文件中获取html元素的ID,并且我想为此使用正则表达式。 我尝试了一些组合但没有运气。 例如,如果我有一行:
<a href="#" id="thisAnchor" >Link to somewhere</a><div id="divToCollect">BigDiv</div>
我想要得到: thisAnchor
和divToCollect
。 我正在使用正则表达式:
Regex.Matches(currentLine, expression);
您不应为此使用正则表达式,而应使用HtmlAgilityPack,并且在获取所需的所有属性时将没有问题:
string html = "<div id='divid'></div><a id='ancorid'></a>";
var doc = new HtmlDocument();
doc.LoadHtml(html);
var divIds = doc.DocumentNode
.Descendants("div")
.Where(div => div.Attributes["id"] != null)
.Select(div => div.Attributes["id"].Value)
.ToList();
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.