簡體   English   中英

正則表達式在錨標記C#之后獲取文本

[英]Regex to get text After anchor tag C#

我有一個C#正則表達式,如下所示:

Regex r = new Regex(@"(?<value1>.*?)<a.*?href=(""|')(?<href>.*?)(""|').*?>(?<value2>.*?)</a>(?<value3>.*?)");

我可以獲得value1,href,value2完美的文本。 但是,value3始終為“”。

我想得到錨點結束tag()之后的文本,我缺少什么。

如果改用解析器 ,則不會返回null值,因為用正則表達式解析HTML並不是解決此問題的最佳方法。 但是要解決此問題,請從表達式的末尾刪除非貪婪的量詞,使其變得貪婪( 匹配盡可能多的量 )。

(?<value3>.*?)
            ^ Remove non-greedy quantifier

並使其貪婪

(?<value3>.*)

觀看現場演示

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM