当我尝试在 R 中获取 2 个变量的计数时，为什么会收到错误消息？

Question

我正在尝试按 2 个变量进行频率计数。 这是我的数据，在数据框“api”中：

      Name          Grade
1     John Smith    C     
2     John Smith    B       
3     John Smith    C      
4     Jane Doe      A     
5     Jane Doe      C     
6     Lisa Brown    B

我要这个：

      Name          Grade   Freq
1     John Smith    C       2    
2     John Smith    B       1  
3     John Smith    C       2 
4     Jane Doe      A       1 
5     Jane Doe      C       1   
6     Lisa Brown    B       1

这是我的代码：

api_count<-count(api, c("Name", "Grade")

我收到此错误消息：

Error: Problem with `mutate()` input `..1`.
x Input `..1` can't be recycled to size 28328.
i Input `..1` is `c("Name", "Grade")`.
i Input `..1` must be size 28328 or 1, not 2.

Answer 1

我会建议这种tidyverse方法：

library(tidyverse)
#Code
df %>% group_by(Name,Grade) %>% mutate(N=n())

输出：

# A tibble: 6 x 3
# Groups:   Name, Grade [5]
  Name       Grade     N
  <chr>      <chr> <int>
1 John Smith C         2
2 John Smith B         1
3 John Smith C         2
4 Jane Doe   A         1
5 Jane Doe   C         1
6 Lisa Brown B         1

使用的一些数据：

#Data
df <- structure(list(Name = c("John Smith", "John Smith", "John Smith", 
"Jane Doe", "Jane Doe", "Lisa Brown"), Grade = c("C", "B", "C", 
"A", "C", "B")), class = "data.frame", row.names = c(NA, -6L))

Answer 2

我认为你的代码大部分是正确的，只有一些小的语法问题：

api <- data.frame(Name = c(rep("John Smith",3), rep("Jane Doe", 2), "Lisa Brown"), Grade = c("C", "B", "C", "A", "C","B")))
api
   Name Grade
1 John Smith     C
2 John Smith     B
3 John Smith     C
4   Jane Doe     A
5   Jane Doe     C
6 Lisa Brown     B

count(api, c("Name", "Grade"))
        Name Grade freq
1   Jane Doe     A    1
2   Jane Doe     C    1
3 John Smith     B    1
4 John Smith     C    2
5 Lisa Brown     B    1

Answer 3

我觉得@鸭是最直接的方法（和首选;而与此数据，计算时间的一半），但这里的情况下，它更有意义的选择： count ，然后join回来的原始数据：

df %>%
  count(Name, Grade) %>%
  left_join(df, ., by = c("Name", "Grade"))
#         Name Grade n
# 1 John Smith     C 2
# 2 John Smith     B 1
# 3 John Smith     C 2
# 4   Jane Doe     A 1
# 5   Jane Doe     C 1
# 6 Lisa Brown     B 1

Answer 4

我们可以使用add_count

library(dplyr)
df %>% 
  add_count(Name, Grade)
#        Name Grade n
#1 John Smith     C 2
#2 John Smith     B 1
#3 John Smith     C 2
#4   Jane Doe     A 1
#5   Jane Doe     C 1
#6 Lisa Brown     B 1

数据

df <- structure(list(Name = c("John Smith", "John Smith", "John Smith", 
"Jane Doe", "Jane Doe", "Lisa Brown"), Grade = c("C", "B", "C", 
"A", "C", "B")), class = "data.frame", row.names = c(NA, -6L))

当我尝试在 R 中获取 2 个变量的计数时，为什么会收到错误消息？

问题描述

4 个解决方案

解决方案1
1 2020-09-03 14:42:32

解决方案2
1 2020-09-03 14:44:16

解决方案3
0 2020-09-03 14:46:17

解决方案4
0 2020-09-03 23:05:32

数据

当我尝试在 R 中获取 2 个变量的计数时，为什么会收到错误消息？

问题描述

4 个解决方案

解决方案1 1 2020-09-03 14:42:32

解决方案2 1 2020-09-03 14:44:16

解决方案3 0 2020-09-03 14:46:17

解决方案4 0 2020-09-03 23:05:32

数据

解决方案1
1 2020-09-03 14:42:32

解决方案2
1 2020-09-03 14:44:16

解决方案3
0 2020-09-03 14:46:17

解决方案4
0 2020-09-03 23:05:32