繁体   English   中英

使用C#中的regex检索给定句子的所有id

[英]Retrieve all the ids for a given sentence using regex in c#

我正在使用.Net(C#)软件来获取和处理html文件。 我需要从该文件中获取html元素的ID,并且我想为此使用正则表达式。 我尝试了一些组合但没有运气。 例如,如果我有一行:

<a href="#" id="thisAnchor" >Link to somewhere</a><div id="divToCollect">BigDiv</div>

我想要得到: thisAnchordivToCollect 我正在使用正则表达式:

Regex.Matches(currentLine, expression);

您不应为此使用正则表达式,而应使用HtmlAgilityPack,并且在获取所需的所有属性时将没有问题:

string html = "<div id='divid'></div><a id='ancorid'></a>";
var doc = new HtmlDocument();
doc.LoadHtml(html);

var divIds = doc.DocumentNode
                .Descendants("div")
                .Where(div => div.Attributes["id"] != null)
                .Select(div => div.Attributes["id"].Value)
                .ToList();

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM