[英]+count the number of words in string
我想计算给定字符串中的单词数。 例如,我们正在解析一个大型文本文档。
我用过这种方法
noOfWords = countedStegoText.trim().split(" +").length;
但是,如果文本包含两种空格(例如“ U + 0020”和“ U + 205F”)怎么办?在这种情况下,我如何计算单词数?
.split(...)可以使用正则表达式,只需构建一个包含所有匹配字符的表达式即可。
例如:
"hello world-foo_bar".split("[ |\\-|_]")
结果为长度为4的数组
["hello", "world", "foo", "bar"]
要在RegEx中使用Unicode字符,请使用\\ u ####,因此您需要查找以下内容:
countedStegoText.trim().split("[\u0020|\u205F]").length
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.