[英]Searching for words in a corpus with R
我正在尝试使用R搜索语料库中的单词字符串。grep是否允许析取语句,例如grep(“ a”或“ b”或“ c” ...)? 如果是这样,一旦有了该子语料库,我该如何进一步对其进行完善以仅包含那些带有至少两个原始条件标记的示例?
是的,竖线|
在grep
充当or运算符。 您可以通过运行?regex
在R中查找正?regex
。
因此,举一个例子:
grep("ape|bass|cat", c("monkey", "bass", "catfish"))
[1] 2 3
还要提供grep
, grepl
和该功能家族的文档。 stringr
包提供了其他工具来处理文本。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.