[英]Regex to get text After anchor tag C#
我有一个C#正则表达式,如下所示:
Regex r = new Regex(@"(?<value1>.*?)<a.*?href=(""|')(?<href>.*?)(""|').*?>(?<value2>.*?)</a>(?<value3>.*?)");
我可以获得value1,href,value2完美的文本。 但是,value3始终为“”。
我想得到锚点结束tag()之后的文本,我缺少什么。
如果改用解析器 ,则不会返回null值,因为用正则表达式解析HTML并不是解决此问题的最佳方法。 但是要解决此问题,请从表达式的末尾删除非贪婪的量词,使其变得贪婪( 匹配尽可能多的量 )。
(?<value3>.*?)
^ Remove non-greedy quantifier
并使其贪婪 :
(?<value3>.*)
观看现场演示
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.