繁体   English   中英

如何使用 R 计算每列特定单词的频率?

[英]How to Count the frequency of specific words for each column using R?

我正在使用这个数据集https://archive.ics.uci.edu/ml/datasets/Eco-hotel

我试图弄清楚如何计算每列中某些单词(例如“房间”或“假期”)的频率。 我曾尝试在线学习教程,但不幸的是,我没有运气。

以 iris 数据集为例,你可以做的是:

library(tidyverse)

iris %>%
  summarize(across(everything(), ~ sum(str_detect(., 'setosa'))))

当然,您需要将 seqrch 术语更改为您需要的内容。

如果您想为每个搜索模式设置专用列,您也可以这样做。 喜欢:

df <- data.frame(x = sample(letters, 10, replace = TRUE),
                 y = sample(letters, 10, replace = TRUE))

df |> 
  summarize(across(c(x, y), ~sum(str_count(., c("u"))), .names = "{.col}_u"),
            across(c(x, y), ~sum(str_count(., c("g"))), .names = "{.col}_g"))

在这里,我分别搜索字母“u”和“g”。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM