聚合 function 以在 R 中創建頻率矩陣

Question

我是這里的菜鳥，所以請不要評判我；）

我想創建一個頻率矩陣，其中列名是作者，行名是具有頻率計數的語言。

我的數據如下所示：

language    author
----------------------
ita         Goethe
ger         Schiller
eng         Marx
fr          Marx
po          Schiller
eng         Marx

結果我想要這樣的東西

            ita    ger     eng     fr    po
----------------------------------------------
Schiller     0      1       0       0    1
Goethe       1      0       0       0    0
Marx         0      0       2       1    0

我嘗試將 aggregate() function 與以下內容一起使用：

df1 <- lapply(df, function(x) type.convert(as.character(x)))
aggregate(. ~ language, df1, sum)

但這似乎不起作用。 我怎樣才能重寫它以獲得第二個表。

非常感謝你。 非常感謝您的幫助。

Answer 1

我認識到您可能正在尋找一個基本版本來確定這一點，但臨時的 tidyverse 方法是：

library(tidyverse)

# creating data
dat <- tribble(~language,    ~author,
        "ita",         "Goethe",
        "ger",         "Schiller",
        "eng",         "Marx",
        "fr",         "Marx",
        "po",         "Schiller",
        "eng",         "Marx")

dat %>% 
  count(language, author) %>% 
  pivot_wider(names_from = language, values_from = n, values_fill = list(n = 0))

# A tibble: 3 x 6
  author     eng    fr   ger   ita    po
  <chr>    <int> <int> <int> <int> <int>
1 Marx         2     1     0     0     0
2 Schiller     0     0     1     0     1
3 Goethe       0     0     0     1     0

Answer 2

帶底座 R：

df <- read.table(text = "
language    author
ita         Goethe
ger         Schiller
eng         Marx
fr          Marx
po          Schiller
eng         Marx", h = T)

as.data.frame.matrix(table(df$author, df$language))

         eng fr ger ita po
Goethe     0  0   0   1  0
Marx       2  1   0   0  0
Schiller   0  0   1   0  1

不過，這會按字母順序對行名和列名進行排序。

Answer 3

使用菲爾的數據，

library(tidyr)
table(dat) %>% data.frame() %>% spread(language, Freq)

#     author eng fr ger ita po
#1   Goethe   0  0   0   1  0
#2     Marx   2  1   0   0  0
#3 Schiller   0  0   1   0  1

Answer 4

帶有acast的選項

library(reshape2)
acast(df, author ~ language, length)

數據

df <- structure(list(language = c("ita", "ger", "eng", "fr", "po", 
"eng"), author = c("Goethe", "Schiller", "Marx", "Marx", "Schiller", 
"Marx")), class = "data.frame", row.names = c(NA, -6L))

聚合 function 以在 R 中創建頻率矩陣

問題描述

4 個解決方案

解決方案1
1 2020-07-31 05:55:03

解決方案2
1 2020-07-31 05:58:17

解決方案3
0 已采納 2020-07-31 06:05:09

解決方案4
0 2020-07-31 22:33:53

數據

聚合 function 以在 R 中創建頻率矩陣

問題描述

4 個解決方案

解決方案1 1 2020-07-31 05:55:03

解決方案2 1 2020-07-31 05:58:17

解決方案3 0 已采納 2020-07-31 06:05:09

解決方案4 0 2020-07-31 22:33:53

數據

解決方案1
1 2020-07-31 05:55:03

解決方案2
1 2020-07-31 05:58:17

解決方案3
0 已采納 2020-07-31 06:05:09

解決方案4
0 2020-07-31 22:33:53