繁体   English   中英

使用C#中的正则表达式从html字符串中提取句子

[英]Extract sentence from html string using Regular Expression in C#

我有一个控件,该控件返回一个数据表,该数据表由html代码作为每一行的字符串组成。 我正在尝试使用正则表达式仅提取HTML标记中包含的单词

{[h]</span></p><p class="MsoNormal" style="text-align: left;"><span style="color: #ff6600; font-weight: bold;"><span style="font-family: arial, helvetica, sans-serif;">What do they mean today?</span></span></p><p style="text-align: left; margin: 0px;"><span style="font-family: arial, helvetica, sans-serif;">[/h]}

我只想提取一句话, 今天它们是什么意思? 或任何包含超过1个单词的句子。

我试过(/ w * / s?)*,但似乎只看字符串的开头,而不看整个字符串。 我对正则表达式不太满意。 任何帮助都感激不尽。

您可以使用下面的正则表达式来获取所需的字符串。

@"(?<=>)[^<>]+(?=<)"

但是,不建议使用正则表达式来解析html文件。

DEMO

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM