繁体   English   中英

对R中的行进行计数时,无法按日期分组

[英]Trouble grouping by date when counting rows in R

我正在使用唐纳德·特朗普推文的公共数据集,可在此处找到: https : //www.kaggle.com/kingburrito666/better-donald-trump-tweets

这样做之后,我试图按日期将其分组在R中。首先,我想计算推文pr的数量。 第二天,我想总结一下“收藏夹”和“转推”的内容。 天。

我已经编写了以下代码,但是它始终使我出错...您能帮我吗?

提前致谢!

 Donald <- read_csv(file="Donald-Tweets!.csv")
Donald
#Grouped
G_filter <- Donald %>%
  select(Date,twt_favourites_IS_THIS_LIKE_QUESTION_MARK, Retweets) %>% 
  rename( Favourites = twt_favourites_IS_THIS_LIKE_QUESTION_MARK) %>% 
  group_by(as.Date.date(Date)) %>% 
summarise(Total = sum(Favourites+Retweets), count(n))


View(G_filter)

这可能是您要寻找的。

library(tidyverse)

G_filter <- Donald %>%
  select(Date, twt_favourites_IS_THIS_LIKE_QUESTION_MARK, Retweets) %>% 
  rename(Favourites = twt_favourites_IS_THIS_LIKE_QUESTION_MARK) %>% 
  group_by(Date) %>%
  mutate(Favorites_and_Retweets = Favourites + Retweets) %>%
  summarise(Favorites_and_Retweets = sum(Favorites_and_Retweets),
            Count = n())
G_filter
# # A tibble: 479 x 3
#    Date     Favorites_and_Retweets Count
#    <chr>                     <int> <int>
#  1 15-07-16                  66899    39
#  2 15-07-17                  65212    22
#  3 15-07-18                  97381    32
#  4 15-07-19                  34229    12
#  5 15-07-20                  62316    37
#  6 15-07-21                  88132    62
#  7 15-07-22                  69919    37
#  8 15-07-23                  67963    43
#  9 15-07-24                  67687    35
# 10 15-07-25                  39744    25
# # ... with 469 more rows

无需转换“ Date列。 如果您真的想这样做,一种方法是加载lubridate程序包,然后在管道中执行mutate(Date = ymd(Date))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM