[英]How to Count the frequency of specific words for each column using R?
我正在使用這個數據集https://archive.ics.uci.edu/ml/datasets/Eco-hotel
我試圖弄清楚如何計算每列中某些單詞(例如“房間”或“假期”)的頻率。 我曾嘗試在線學習教程,但不幸的是,我沒有運氣。
以 iris 數據集為例,你可以做的是:
library(tidyverse)
iris %>%
summarize(across(everything(), ~ sum(str_detect(., 'setosa'))))
當然,您需要將 seqrch 術語更改為您需要的內容。
如果您想為每個搜索模式設置專用列,您也可以這樣做。 喜歡:
df <- data.frame(x = sample(letters, 10, replace = TRUE),
y = sample(letters, 10, replace = TRUE))
df |>
summarize(across(c(x, y), ~sum(str_count(., c("u"))), .names = "{.col}_u"),
across(c(x, y), ~sum(str_count(., c("g"))), .names = "{.col}_g"))
在這里,我分別搜索字母“u”和“g”。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.