簡體   English   中英

Java中如何使用正則表達式匹配HTML標簽內容

[英]How to use regex to match HTML tag contents in Java

我想要完成的事情:

我想匹配評論之外的某些明確內容。

一個例子:

<div>
    <div>Hello $world$</div>
    <div>Another text <!-- $example$--></div>   
</div>
<div>
    How are $you$?
</div>
<!-- 
<div>
    Lorem ipsum $dolor$ sit
</div>
-->

我想匹配的詞: $world$ , $you$

我不想匹配的詞: $example$ , $dolor$

到目前為止,我只能匹配全部或不匹配。

我不能做什么:

我無法刪除所有評論,因為需要提供我過濾的源代碼。

我不知道你的代碼來自哪里,但你需要將你的頁面讀入一個字符串或字符串[],然后在它上面運行一個正則表達式來提取你想要過濾的字符串。

如何在java中使用帶有正則表達式的流:

如何創建正則表達式匹配流?

如何在java中使用正則表達式:

https://www.tutorialspoint.com/java/java_regular_expressions.htm

在部署之前測試您的正則表達式:

https://regexr.com/

添加交替

/(?:<!--.*?-->)|($.*?$)/gsm
               ^

並檢查第一個捕獲組中是否有任何內容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM