具有多個變量的頻率表，按分類變量分組

Question

我想創建一個由分類變量（顏色）分組的多個變量（X1 - X4）的頻率表。 這是示例數據：

df <- data.frame(name = paste0("obj", 1:6),
                 X1 = c(0,1,1,1,0,1),
                 X2 = c(1,1,1,1,1,1),
                 X3 = c(0,1,1,0,0,0),
                 X4 = c(0,1,1,1,0,0),
                 color = c("red","red","blue","green","green","blue"),
                 other = c(5,3,1,8,4,3))

這就是 output 的理想外觀：

\begin{table}[]
\begin{tabular}{lllll}
Var & red & blue & green & total \\
X1  & 1   & 2    & 1     & 4     \\
X2  & 2   & 2    & 2     & 6     \\
X3  & 1   & 1    & 0     & 2     \\
X4  & 1   & 1    & 1     & 3    
\end{tabular}
\end{table}

非常感謝！

Answer 1

您可以獲取長格式的數據，並為每種color和列sum值，獲取寬格式的數據並添加Total列。

library(dplyr)
library(tidyr)

df %>%
  pivot_longer(cols = starts_with('X'), names_to = 'col') %>%
  group_by(col, color) %>%
  summarise(n = sum(value)) %>%
  pivot_wider(names_from = color, values_from = n) %>%
  ungroup %>%
  janitor::adorn_totals(where = 'col') 
  #Or use `rowSums`
  #mutate(Total = rowSums(.[-1]))

# col blue green red Total
#  X1    2     1   1     4
#  X2    2     2   2     6
#  X3    1     0   1     2
#  X4    1     1   1     3

具有多個變量的頻率表，按分類變量分組

問題描述

1 個解決方案

解決方案1
1 2020-08-18 04:19:18

具有多個變量的頻率表，按分類變量分組

問題描述

1 個解決方案

解決方案1 1 2020-08-18 04:19:18

解決方案1
1 2020-08-18 04:19:18