簡體   English   中英

Java StringTokenizer奇怪的行為

[英]Java StringTokenizer odd behavior

我試圖以此從文檔中僅提取小寫字母數字字符:

String delim = "abcdefghijklmnopqrstuvwxyz0123456789";

StringTokenizer strtok = new StringTokenizer(str, delim, true);

String newstr = "";

while (strtok.hasMoreTokens()) {
    newstr = newstr + strtok.nextToken();
}

return newstr;

請注意,該文檔僅是小寫字母。 但是由於某種原因,所有標點符號仍會與復述和/一起返回。

我認為在創建分詞器時使用真正的布爾值會將分隔符算作令牌嗎?

delim參數是一個定界符。 您基本上是在要求每個令牌是“小寫字母之間的任何字符”。 然后“ true”參數說“也將那些字母也給我”。 您是否在尋找replaceAll("[^abcdefghijklmnopqrstuvwxyz0123456789]","")嗎?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM