簡體   English   中英

StringTokenizer中的多個字符串定界符

[英]Multiple String Delimiters in StringTokenizer

我正在標記一個HTML塊,該塊必須由以下整個標記字符串分割:

<dd>
</dd>
<dt>
</dt>

我無法指定

StringTokenizer st = new StringTokenizer(block,"<dt></dt><dd></dd>");
st.nextToken();

這些不是字符的集合,而是整個字符串的集合。 是否有一種優雅的方式對此進行標記化?

JavaDoc

StringTokenizer是一個遺留類,出於兼容性原因而保留,盡管在新代碼中不鼓勵使用它。 建議任何尋求此功能的人改用String的split方法或java.util.regex包。

因此,如果您有一個String block ,其中包含要標記化的數據。 做類似的事情

String[] tokens = block.split("(<dd>)|(</dd>)|(<dt>)|(</dt>)");

然后您的標記將成為數組tokens的元素

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM