繁体   English   中英

如何在Java中基于下划线拆分句子

[英]How can I split a sentence based on underscore in Java

我目前正在处理文本处理,并且被一个简单的问题分心。 我试图根据下划线拆分句子。 首先,我想出了一种非常简单的方法:

String[] tokens = taggedSentence.split("_");

在大多数情况下,它都可以正常工作,直到我找到如下所示的文字:

Robert_Phd_NNP

但是,我只对POS标签感兴趣,在这种情况下,它是NNP,但仅靠下划线分开似乎还不够。 然后,我想到了一个获取拆分语句的最后一个元素的想法:

String[] tokens = taggedSentence.split("_");
int tokenSize = tokens.length;
String pos = tokens[tokenSize-1];

但是,我想知道是否有更好的方法(例如正则表达式)来做到这一点。 任何意见或建议,将不胜感激。 非常感谢

您无需正则表达式即可轻松完成此操作:

String POStag = taggedSentence.substring(taggedSentence.lastIndexOf('_') + 1);

如果没有下划线,它将仅返回原始字符串。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM