![](/img/trans.png)
[英]R,dplyr: How to replace 0 values based conditional on size of group_by
[英]How to return values from group_by in R dplyr?
早上好,
我有一個兩列的數據集,我想根據Dplyr中的group_by擴展到更多列,但是我不確定如何。
我的數據如下:
Person Case
John A
John B
Bill C
David F
我希望能夠將其轉換為以下結構:
Person Case_1 Case_2 ... Case_n
John A B
Bill C NA
David F NA
我最初的想法是:
data %>%
group_by(Person) %>%
spread()
Error: Please supply column name
什么是最簡單或最像R的方式來實現這一目標?
您應該首先將案例ID添加到數據集中,這可以通過group_by
和mutate
的組合來完成:
dat = data.frame(Person = c('John', 'John', 'Bill', 'David'), Case = c('A', 'B', 'C', 'F'))
dat = dat %>% group_by(Person) %>% mutate(id = sprintf('Case_%d', row_number()))
dat %>% head()
# A tibble: 4 × 3
Person Case id
<fctr> <fctr> <chr>
1 John A Case_1
2 John B Case_2
3 Bill C Case_1
4 David F Case_1
現在,您可以使用spread
來轉換數據:
dat %>% spread(Person, Case)
# A tibble: 2 × 4
id Bill David John
* <chr> <fctr> <fctr> <fctr>
1 Case_1 C F A
2 Case_2 NA NA B
您可以使用以下方法獲取上面列出的結構:
res = dat %>% spread(Person, Case) %>% select(-id) %>% t() %>% as.data.frame()
names(res) = unique(dat$id)
res
Case_1 Case_2
Bill C <NA>
David F <NA>
John A B
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.