[英]Regex to get text After anchor tag C#
我有一個C#正則表達式,如下所示:
Regex r = new Regex(@"(?<value1>.*?)<a.*?href=(""|')(?<href>.*?)(""|').*?>(?<value2>.*?)</a>(?<value3>.*?)");
我可以獲得value1,href,value2完美的文本。 但是,value3始終為“”。
我想得到錨點結束tag()之后的文本,我缺少什么。
如果改用解析器 ,則不會返回null值,因為用正則表達式解析HTML並不是解決此問題的最佳方法。 但是要解決此問題,請從表達式的末尾刪除非貪婪的量詞,使其變得貪婪( 匹配盡可能多的量 )。
(?<value3>.*?)
^ Remove non-greedy quantifier
並使其貪婪 :
(?<value3>.*)
觀看現場演示
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.