R：根據 dplyr 的列值打破 data.frame

Question

我有這個data.frame

MWE <- data.frame(x = c("a", "a", "a", "b", "b", "b"), y = c(1,2,3,4,5,6))

我想要得到的是這個data.frame

data.frame(a = c(1,2,3), b = c(4,5,6))

實際上，我最初想要的是對 2 個向量a和b sum （好吧，實際上我有更多向量，但只有 2 個更容易解釋），所以這就是我考慮這種轉換的原因。 然后我可以做一個rowSums或類似的東西。

我嘗試使用pivot_wider的tidyr ，但出現錯誤。

知道如何使用dplyr或tidyr做到這一點嗎？

Answer 1

繼續@Mr.Flick 在tidyverse中的嘗試，您可以創建一個 id 列並在該 id 列上分組計算總和，如

library(dplyr)

MWE %>%
  group_by(x) %>%
  mutate(row = row_number()) %>%
  group_by(row) %>%
  mutate(total_sum = sum(y)) %>%
  tidyr::pivot_wider(names_from = x, values_from = y) %>%
  ungroup() %>%
  select(-row)

# A tibble: 3 x 3
#  total_sum     a     b
#      <dbl> <dbl> <dbl>
#1         5     1     4
#2         7     2     5
#3         9     3     6

Answer 2

我們可以使用來自base R unstack unstack

unstack(MWE, y ~ x)
#  a b
#1 1 4
#2 2 5
#3 3 6

或者使用來自tidyr的rowid和來自data.table的pivot_wider

library(dplyr)
library(data.table)
library(tidyr)
MWE %>% 
   mutate(rn = rowid(x)) %>% 
   pivot_wider(names_from = x, values_from = y) %>%
   select(-rn)
# A tibble: 3 x 2
#      a     b
#  <dbl> <dbl>
#1     1     4
#2     2     5
#3     3     6

Answer 3

使用基礎 R：

data.frame(with(MWE, split(y, x)))

  a b
1 1 4
2 2 5
3 3 6

R：根據 dplyr 的列值打破 data.frame

問題描述

3 個解決方案

解決方案1
1 已采納 2019-12-09 11:16:58

解決方案2
1 2019-12-09 14:58:25

解決方案3
0 2019-10-23 15:33:51

R：根據 dplyr 的列值打破 data.frame

問題描述

3 個解決方案

解決方案1 1 已采納 2019-12-09 11:16:58

解決方案2 1 2019-12-09 14:58:25

解決方案3 0 2019-10-23 15:33:51

解決方案1
1 已采納 2019-12-09 11:16:58

解決方案2
1 2019-12-09 14:58:25

解決方案3
0 2019-10-23 15:33:51