[英]Multiple String Delimiters in StringTokenizer
我正在標記一個HTML塊,該塊必須由以下整個標記字符串分割:
<dd>
</dd>
<dt>
</dt>
我無法指定
StringTokenizer st = new StringTokenizer(block,"<dt></dt><dd></dd>");
st.nextToken();
這些不是字符的集合,而是整個字符串的集合。 是否有一種優雅的方式對此進行標記化?
從JavaDoc :
StringTokenizer是一個遺留類,出於兼容性原因而保留,盡管在新代碼中不鼓勵使用它。 建議任何尋求此功能的人改用String的split方法或java.util.regex包。
因此,如果您有一個String block
,其中包含要標記化的數據。 做類似的事情
String[] tokens = block.split("(<dd>)|(</dd>)|(<dt>)|(</dt>)");
然后您的標記將成為數組tokens
的元素
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.