[英]Java StringTokenizer odd behavior
我試圖以此從文檔中僅提取小寫字母數字字符:
String delim = "abcdefghijklmnopqrstuvwxyz0123456789";
StringTokenizer strtok = new StringTokenizer(str, delim, true);
String newstr = "";
while (strtok.hasMoreTokens()) {
newstr = newstr + strtok.nextToken();
}
return newstr;
請注意,該文檔僅是小寫字母。 但是由於某種原因,所有標點符號仍會與復述和/一起返回。
我認為在創建分詞器時使用真正的布爾值會將分隔符算作令牌嗎?
delim參數是一個定界符。 您基本上是在要求每個令牌是“小寫字母之間的任何字符”。 然后“ true”參數說“也將那些字母也給我”。 您是否在尋找replaceAll("[^abcdefghijklmnopqrstuvwxyz0123456789]","")
嗎?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.