簡體   English   中英

正則表達式與C#中的字符串不匹配

[英]Regular expression to not match a string in C#

我有一些HTML(我需要在一個大文檔中)將其解析為文本,而我感興趣的部分如下所示:

...
<div id="whatever" class="whatever whatever">some title with <em>html</em> and other such tags in it, but never a div tag</div>
...

現在,我想從中獲取帶有HTML的DIV中的文本。 這是我對正則表達式的使用(使用組):

<div id=\"whatever\" class=\"whatever whatever\">(?<title>[^</div>]*?)</div>

因此,我的想法是將整個內容匹配起來,並得到一個包含所有文本的組,直到出現</ div>為止(因為該字符串的末尾沒有其他識別因素)。

[]中的^不起作用,因為它是這些字符的“任意”,而不是我想要的字符串“ </ div>”。 有什么想法可以使我工作嗎?

Match m=Regex.Match(s,"\\<div id=\"whatever\" class=\"whatever whatever\">(.*?)\\<\\/div\\>");                                                       
Console.WriteLine(m.Groups[1].Value);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM