簡體   English   中英

使用正則表達式在Java中拆分字符串

[英]Split string in java using regex

我想在文本的開頭和結尾分割一些標簽(div和p),而不是全部。

Input:
String html = "text<div>some text</div><tag>text</tag><span>asd</span><p>text</p>text";

Output:
text
<div>some text</div>
<tag>text</tag><span>asd</span>
<p>text</p>
text

我應該使用什么正則表達式?

您可以使用此正則表達式拆分

(?<=</(div|p)>)|(?=<(div|p)>)

但正如其他人建議使用html解析器。


但是為什么要使用解析器呢?

考慮上面的正則表達式。 那行不通

  • 如果你有嵌套的標簽。(無正則表達式可以解決這個problem..It的幾乎不可能
  • 標簽是否具有屬性
  • 如果標簽內有任意數量的空格

雖然,但不清楚為什么要進行此拆分

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM