如何使用 R 計算每列特定單詞的頻率？

Question

我正在使用這個數據集https://archive.ics.uci.edu/ml/datasets/Eco-hotel

我試圖弄清楚如何計算每列中某些單詞（例如“房間”或“假期”）的頻率。 我曾嘗試在線學習教程，但不幸的是，我沒有運氣。

Answer 1

以 iris 數據集為例，你可以做的是：

library(tidyverse)

iris %>%
  summarize(across(everything(), ~ sum(str_detect(., 'setosa'))))

當然，您需要將 seqrch 術語更改為您需要的內容。

如果您想為每個搜索模式設置專用列，您也可以這樣做。 喜歡：

df <- data.frame(x = sample(letters, 10, replace = TRUE),
                 y = sample(letters, 10, replace = TRUE))

df |> 
  summarize(across(c(x, y), ~sum(str_count(., c("u"))), .names = "{.col}_u"),
            across(c(x, y), ~sum(str_count(., c("g"))), .names = "{.col}_g"))

在這里，我分別搜索字母“u”和“g”。

如何使用 R 計算每列特定單詞的頻率？

問題描述

1 個解決方案

解決方案1
0 2022-09-22 05:14:16

如何使用 R 計算每列特定單詞的頻率？

問題描述

1 個解決方案

解決方案1 0 2022-09-22 05:14:16

解決方案1
0 2022-09-22 05:14:16