[英]r cut report results for all intervals, including empty ones
我有一些數據,我想計算中斷的出現次數,如下所示。 runif 語句生成一個不帶零的向量,因此我創建了兩個數據幀,一個帶有零,一個不帶零
library(dplyr)
breaks <- c(0, 1, 25, 50, 75, 100)
testValues <- runif(50, min = 0, max = 100)
testValues_df <- data.frame(lyr1 = testValues)
testValues_w0 <- c(testValues, 0)
testValues_w0_df <- data.frame(lyr1 = testValues_w0)
testValues_df %>%
group_by(gr=cut(lyr1, breaks= breaks, include.lowest = FALSE, right = FALSE) ) %>%
summarise(n= n()) %>%
arrange(as.numeric(gr))
testValues_w0_df %>%
group_by(gr=cut(lyr1, breaks= breaks, include.lowest = FALSE, right = FALSE) ) %>%
summarise(n= n()) %>%
arrange(as.numeric(gr))
結果是
# A tibble: 5 × 2
gr n
<fct> <int>
1 [0,1) 1
2 [1,25) 12
3 [25,50) 11
4 [50,75) 18
5 [75,100) 9
但是,如果我不將 0 添加到數據向量中,我會得到這個。
A tibble: 4 × 2
gr n
<fct> <int>
1 [1,25) 12
2 [25,50) 11
3 [50,75) 18
4 [75,100) 9
有沒有辦法強制第二個 output 包含 [0,1] 0?
之后我們可以使用complete
的
library(dplyr)
library(tidyr)
testValues_w0_df %>%
group_by(gr=cut(lyr1, breaks= breaks, include.lowest = FALSE,
right = FALSE) ) %>%
summarise(n= n(), .groups = 'drop') %>%
arrange(as.numeric(gr)) %>%
complete(gr = levels(gr), fill = list(n = 0))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.