簡體   English   中英

使用C#中的正則表達式從html字符串中提取句子

[英]Extract sentence from html string using Regular Expression in C#

我有一個控件,該控件返回一個數據表,該數據表由html代碼作為每一行的字符串組成。 我正在嘗試使用正則表達式僅提取HTML標記中包含的單詞

{[h]</span></p><p class="MsoNormal" style="text-align: left;"><span style="color: #ff6600; font-weight: bold;"><span style="font-family: arial, helvetica, sans-serif;">What do they mean today?</span></span></p><p style="text-align: left; margin: 0px;"><span style="font-family: arial, helvetica, sans-serif;">[/h]}

我只想提取一句話, 今天它們是什么意思? 或任何包含超過1個單詞的句子。

我試過(/ w * / s?)*,但似乎只看字符串的開頭,而不看整個字符串。 我對正則表達式不太滿意。 任何幫助都感激不盡。

您可以使用下面的正則表達式來獲取所需的字符串。

@"(?<=>)[^<>]+(?=<)"

但是,不建議使用正則表達式來解析html文件。

DEMO

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM