簡體   English   中英

如何使用 R 計算每列特定單詞的頻率?

[英]How to Count the frequency of specific words for each column using R?

我正在使用這個數據集https://archive.ics.uci.edu/ml/datasets/Eco-hotel

我試圖弄清楚如何計算每列中某些單詞(例如“房間”或“假期”)的頻率。 我曾嘗試在線學習教程,但不幸的是,我沒有運氣。

以 iris 數據集為例,你可以做的是:

library(tidyverse)

iris %>%
  summarize(across(everything(), ~ sum(str_detect(., 'setosa'))))

當然,您需要將 seqrch 術語更改為您需要的內容。

如果您想為每個搜索模式設置專用列,您也可以這樣做。 喜歡:

df <- data.frame(x = sample(letters, 10, replace = TRUE),
                 y = sample(letters, 10, replace = TRUE))

df |> 
  summarize(across(c(x, y), ~sum(str_count(., c("u"))), .names = "{.col}_u"),
            across(c(x, y), ~sum(str_count(., c("g"))), .names = "{.col}_g"))

在這里,我分別搜索字母“u”和“g”。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM