[英]Searching for words in a corpus with R
我正在嘗試使用R搜索語料庫中的單詞字符串。grep是否允許析取語句,例如grep(“ a”或“ b”或“ c” ...)? 如果是這樣,一旦有了該子語料庫,我該如何進一步對其進行完善以僅包含那些帶有至少兩個原始條件標記的示例?
是的,豎線|
在grep
充當or運算符。 您可以通過運行?regex
在R中查找正?regex
。
因此,舉一個例子:
grep("ape|bass|cat", c("monkey", "bass", "catfish"))
[1] 2 3
還要提供grep
, grepl
和該功能家族的文檔。 stringr
包提供了其他工具來處理文本。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.