[英]Regular expression for hyphens mixed words
我可以使用string.split("\\\\W+")
使单词仅包含字符。
然而:
我不想将诸如“ re-use”之类的单词分解为“ re”和“ use” 。
还有带有多个连字符的“偏僻”之类的词。
我想将“ and--oh”分解为“ and”和“ oh” 。
我怎么可能实现呢?
试试这个正则表达式:
string.split("[^\\w\\-]+|--+")
您可以先将连续的连字符替换为特殊字符,然后再进行简单的正则表达式拆分。
请参考下面的代码。
public class Test {
public static void main(String args[]){
String str = "This is^^some@@words-apple-banana--orange";
str = str.replaceAll("[-]{2,}", "@");
System.out.println(str);
String regex = "[^\\w-]+";
String arr[] = str.split(regex);
for(String item:arr){
System.out.println(item);
}
}
}
结果是:
This are^^some@@words-apple-banana@orange
This
are
some
words-apple-banana
orange
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.