繁体   English   中英

Java中如何使用正则表达式匹配HTML标签内容

[英]How to use regex to match HTML tag contents in Java

我想要完成的事情:

我想匹配评论之外的某些明确内容。

一个例子:

<div>
    <div>Hello $world$</div>
    <div>Another text <!-- $example$--></div>   
</div>
<div>
    How are $you$?
</div>
<!-- 
<div>
    Lorem ipsum $dolor$ sit
</div>
-->

我想匹配的词: $world$ , $you$

我不想匹配的词: $example$ , $dolor$

到目前为止,我只能匹配全部或不匹配。

我不能做什么:

我无法删除所有评论,因为需要提供我过滤的源代码。

我不知道你的代码来自哪里,但你需要将你的页面读入一个字符串或字符串[],然后在它上面运行一个正则表达式来提取你想要过滤的字符串。

如何在java中使用带有正则表达式的流:

如何创建正则表达式匹配流?

如何在java中使用正则表达式:

https://www.tutorialspoint.com/java/java_regular_expressions.htm

在部署之前测试您的正则表达式:

https://regexr.com/

添加交替

/(?:<!--.*?-->)|($.*?$)/gsm
               ^

并检查第一个捕获组中是否有任何内容。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM