繁体   English   中英

正则表达式在锚标记C#之后获取文本

[英]Regex to get text After anchor tag C#

我有一个C#正则表达式,如下所示:

Regex r = new Regex(@"(?<value1>.*?)<a.*?href=(""|')(?<href>.*?)(""|').*?>(?<value2>.*?)</a>(?<value3>.*?)");

我可以获得value1,href,value2完美的文本。 但是,value3始终为“”。

我想得到锚点结束tag()之后的文本,我缺少什么。

如果改用解析器 ,则不会返回null值,因为用正则表达式解析HTML并不是解决此问题的最佳方法。 但是要解决此问题,请从表达式的末尾删除非贪婪的量词,使其变得贪婪( 匹配尽可能多的量 )。

(?<value3>.*?)
            ^ Remove non-greedy quantifier

并使其贪婪

(?<value3>.*)

观看现场演示

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM