[英]In R How to bin tibble data?
我有这样的小标题。
# A tibble: 200,000 × 3
Steps Distance run
<int> <dbl> <chr>
1 1000 33.32683 0
2 2000 35.02510 0
3 3000 36.19157 0
4 4000 37.82663 0
5 5000 36.30477 0
6 6000 37.78146 0
7 7000 38.62345 0
8 8000 34.84085 0
9 9000 37.05461 0
10 10000 43.02439 0
11 10000 44.12345 1
我想使用“运行”的group_by。 然后将值合并到特定数量的容器中。 做这样的事情。
run Interval Count
0 0-10 xx
0 10-100 xx
1 0-10 xx
我发现了一个类似“ bin_data”的函数,但它与group_by不兼容。
谢谢。
您可以先对数据进行分箱,然后使用summary和n计数每组中的观察数。
data_frame(Group = sample(letters[1:2],20,replace = T),Value=runif(20,0,5)) %>%
mutate(Bin = cut(Value,breaks = 0:5)) %>%
group_by(Group,Bin) %>%
summarise(Count = n())
Source: local data frame [8 x 3]
Groups: Group [?]
Group Bin Count
<chr> <fctr> <int>
1 a (0,1] 1
2 a (1,2] 6
3 a (2,3] 2
4 a (4,5] 4
5 b (0,1] 1
6 b (1,2] 2
7 b (3,4] 2
8 b (4,5] 2
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.