[英]Set of Characters as Delimiter in string tokenizer JAVA [duplicate]
这个问题已经在这里有了答案:
如何基于字符集作为分隔符将文本拆分为句子? 我有一个功能,用户可以输入文本和定界符。 分隔符可以是单个字符或字符串(用户可以将“ xyz”指定为分隔符)。 我试过了StringTokenizer(text, delimiter)
,它仅将字符作为分隔符。 下一个选项是String.split()
但是当我给定界符(例如“ **” String.split()
,此选项将失败。 它要求在定界符后附加“ \\”。 追加“ \\”看起来非常繁琐,因为如果分隔符为“ **”,那么我必须将其更改为“ \\ * \\ *”。 如果定界符为“ <TAB>”,那么我的拆分函数看起来像String [] sentences = text.split("\\\\<TAB\\\\>");
有没有一种简单的方法可以将文本分成基于字符集作为定界符的句子?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.