繁体   English   中英

+计算字符串中的单词数

[英]+count the number of words in string

我想计算给定字符串中的单词数。 例如,我们正在解析一个大型文本文档。

我用过这种方法

noOfWords = countedStegoText.trim().split(" +").length;

但是,如果文本包含两种空格(例如“ U + 0020”和“ U + 205F”)怎么办?在这种情况下,我如何计算单词数?

.split(...)可以使用正则表达式,只需构建一个包含所有匹配字符的表达式即可。

例如:

"hello world-foo_bar".split("[ |\\-|_]")

结果为长度为4的数组

["hello", "world", "foo", "bar"]

要在RegEx中使用Unicode字符,请使用\\ u ####,因此您需要查找以下内容:

countedStegoText.trim().split("[\u0020|\u205F]").length

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM