[英]R factor levels as column names and count values
我想將不同變量的因子水平作為列名和每個PatID的計數值。 我所擁有的是:
data_sample <- data.frame(
PatID = c(1L, 1L, 1L, 2L, 2L, 3L, 3L, 3L, 3L),
status1 = c("I250", "NA", "NA", "X560", "M206", "NA", "NA", "M206", "NA"),
status2 = c(".", "M206", "NA", "I250", "I250", "M206", "NA", "NA", "X560"),
status3 = c(".", "I250", "NA", "NA", "NA", "I250", "X560", "NA", "NA")
)
我想要的是以下內容:
PatID I250 M206 X560
1 2 1 0
2 2 1 1
3 1 2 2
有人可以幫忙嗎? 我嘗試了dcast和其他方法,但結果從未出現
data_sample <- data.frame(
PatID = c(1L, 1L, 1L, 2L, 2L, 3L, 3L, 3L, 3L),
status1 = c("I250", "NA", "NA", "X560", "M206", "NA", "NA", "M206", "NA"),
status2 = c(".", "M206", "NA", "I250", "I250", "M206", "NA", "NA", "X560"),
status3 = c(".", "I250", "NA", "NA", "NA", "I250", "X560", "NA", "NA")
)
library(tidyverse)
data_sample %>%
gather(status_num, value, -PatID) %>%
filter(value != "NA", value != ".") %>%
count(PatID, value) %>% # Improvement by @antoniosk
spread(value, n, fill = 0)
# A tibble: 3 x 4
# Groups: PatID [3]
PatID I250 M206 X560
<int> <int> <int> <int>
1 1 2 1 NA
2 2 2 1 1
3 3 1 2 2
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.