[英]How to Count the frequency of specific words for each column using R?
我正在使用这个数据集https://archive.ics.uci.edu/ml/datasets/Eco-hotel
我试图弄清楚如何计算每列中某些单词(例如“房间”或“假期”)的频率。 我曾尝试在线学习教程,但不幸的是,我没有运气。
以 iris 数据集为例,你可以做的是:
library(tidyverse)
iris %>%
summarize(across(everything(), ~ sum(str_detect(., 'setosa'))))
当然,您需要将 seqrch 术语更改为您需要的内容。
如果您想为每个搜索模式设置专用列,您也可以这样做。 喜欢:
df <- data.frame(x = sample(letters, 10, replace = TRUE),
y = sample(letters, 10, replace = TRUE))
df |>
summarize(across(c(x, y), ~sum(str_count(., c("u"))), .names = "{.col}_u"),
across(c(x, y), ~sum(str_count(., c("g"))), .names = "{.col}_g"))
在这里,我分别搜索字母“u”和“g”。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.