總結 2 個不同列中一列的值的計數

Question

我有一個名為reviews_gh的df，格式如下

Date         Market  Positive.or.Negative.
01-01-2020     A              Positive
01-01-2020     A              Positive
01-01-2020     B              Positive
01-01-2020     B              Negative
....

我正在嘗試按日期和業務分組，並創建一個名為正面和負面的新列，它總結了當天在該市場中負面和正面的次數

這是我現在擁有的代碼

  reviews_gh_agg <- reviews_gh %>% 
  group_by(Date, Market) %>% 
  summarise(positive = sum(reviews_gh$Positive.or.Negative.=="Positive"), negative = 
  sum(reviews_gh$Positive.or.Negative.=="Negative") )

但是我得到的結果是錯誤的，我在新的正負列上得到所有觀察的總和，而不是按天和市場分組

頂部小例子的結果應該是

    Date         Market  Positive     Negative
01-01-2020     A            2            0
01-01-2020     B            1            1

謝謝您的幫助

Answer 1

我希望這就是你要找的。 我只是對您的代碼進行了輕微修改，因為由於數據屏蔽，您不需要$來引用tidyverse中的列名。

df %>% 
  group_by(Date, Market) %>% 
  summarise(positive = sum(Positive.or.Negative.=="Positive"), negative = 
              sum(Positive.or.Negative.=="Negative"))


# A tibble: 2 x 4
# Groups:   Date [1]
  Date       Market positive negative
  <chr>      <chr>     <int>    <int>
1 01-01-2020 A             2        0
2 01-01-2020 B             1        1

更新了親愛的@akrun 的另一個有價值的解決方案。

df %>%
  group_by(Date, Market) %>%
  summarise(out = list(table(Positive.or.Negative.)), .groups = "drop") %>%
  unnest_wider(c(out))

# A tibble: 2 x 4
  Date       Market Positive Negative
  <chr>      <chr>     <int>    <int>
1 01-01-2020 A             2       NA
2 01-01-2020 B             1        1

日期

df <- tribble(
  ~Date,         ~Market,  ~Positive.or.Negative.,
  "01-01-2020",     "A",              "Positive",
  "01-01-2020",     "A",              "Positive",
  "01-01-2020",     "B",              "Positive",
  "01-01-2020",     "B",              "Negative"
)

Answer 2

這是另一個tidyverse解決方案，使用count和pivot_wider 。

library(tidyverse)

df %>% 
  # Group by Date, Market and Positive/Negative
  group_by(Date, Market, Positive.or.Negative.) %>%
  # Count
  count() %>%
  # Change to wide format, fill NA with 0's
  pivot_wider(names_from = Positive.or.Negative.,
              values_from = n,
              values_fill = 0)

Answer 3

您可以使用tidyr::pivot_wider執行此操作：

tidyr::pivot_wider(df, names_from = Positive.or.Negative., 
                       values_from = Positive.or.Negative., 
                       values_fn = length, 
                       values_fill = 0)

#  Date       Market Positive Negative
#  <chr>      <chr>     <int>    <int>
#1 01-01-2020 A             2        0
#2 01-01-2020 B             1        1

並使用data.table ：

library(data.table)

dcast(setDT(df),  Date + Market~Positive.or.Negative., 
      value.var = 'Positive.or.Negative.', fun.aggregate = length)

總結 2 個不同列中一列的值的計數

問題描述

3 個解決方案

解決方案1
2 已采納 2021-04-21 23:29:42

解決方案2
1 2021-04-21 23:45:57

解決方案3
0 2021-04-22 03:58:11

總結 2 個不同列中一列的值的計數

問題描述

3 個解決方案

解決方案1 2 已采納 2021-04-21 23:29:42

解決方案2 1 2021-04-21 23:45:57

解決方案3 0 2021-04-22 03:58:11

解決方案1
2 已采納 2021-04-21 23:29:42

解決方案2
1 2021-04-21 23:45:57

解決方案3
0 2021-04-22 03:58:11