dplyr總結邏輯條件

Question

我有以下數據框

df <- data.frame(Gender = c(rep(c("M","F"),each=4)),
             DiffA=c(1,1,-1,-1,1,1,1,-1),
             DiffB=c(1,-1,1,-1,1,1,1,-1))

我想創建2個新變量，針對每個性別進行總結：i）DiffA和DiffB為正的行數； ii）DiffA和DiffB為負的行數，以便獲得：

df2 <- data.frame(Gender = c("M","F"),
             Diff_Pos=c(1,3),
             Diff_Neg=c(1,1))

我未能結合來自dplyr n（）的摘要函數，該函數返回行數和所需的邏輯語句。 提前致謝

Answer 1

我會考慮做

library(tidyr)
df %>% filter(DiffA == DiffB) %>% count(Gender, DiffA) %>% spread(DiffA, n)

  Gender    -1     1
#   (fctr) (int) (int)
# 1      F     1     3
# 2      M     1     1

類似的data.table代碼是

dcast(df[DiffA == DiffB, .N, by=.(Gender, DiffA)], Gender ~ DiffA)

#    Gender -1 1
# 1:      F  1 3
# 2:      M  1 1

如果實際數據超出-1和1 ，則將相關列包裝在sign() 。

Answer 2

這是base R選項

 with(subset(df, DiffA==DiffB), table(Gender, DiffA))
 #      DiffA
 #Gender -1 1
 #     F  1 3
 #     M  1 1

Answer 3

這應該工作：

df %>% 
  dplyr::mutate(
    Diff_Pos = DiffA > 0 & DiffB > 0,
    Diff_Neg = DiffA < 0 & DiffB < 0) %>% 
  dplyr::group_by(Gender) %>% 
  dplyr::summarise(
    Diff_Pos = sum(Diff_Pos),
    Diff_Neg = sum(Diff_Neg))

dplyr總結邏輯條件

問題描述

3 個解決方案

解決方案1
3 2016-04-12 19:37:16

解決方案2
1 2016-04-13 02:12:25

解決方案3
0 2016-04-13 00:50:51

dplyr總結邏輯條件

問題描述

3 個解決方案

解決方案1 3 2016-04-12 19:37:16

解決方案2 1 2016-04-13 02:12:25

解決方案3 0 2016-04-13 00:50:51

解決方案1
3 2016-04-12 19:37:16

解決方案2
1 2016-04-13 02:12:25

解決方案3
0 2016-04-13 00:50:51