[英]How can I refresh a data source from an R package automatically? Specifically the coronavirus CRAN package data
我正在使用约翰霍普金斯冠状病毒 R 包,但我还没有想出如何让它每天为我提供底层更新数据。 我已经重新启动了 R 并重新加载了包,但从我安装包时开始,数据似乎是静态的。 除非我重新安装软件包,否则每次运行它时它都不会提供更新的数据。 这个包背后的数据每晚都会在存储库上更新。 我正试图找出一种让我的每天更新的好方法。
在此先感谢您提供的任何帮助!
library(coronavirus)
library(dplyr)
data("coronavirus")
summary_df <- coronavirus %>% group_by(Country.Region, type) %>%
summarise(total_cases = sum(cases)) %>%
arrange(-total_cases)
df <- coronavirus %>%
group_by(Province.State,Country.Region,Lat,Long,type) %>%
mutate(TotalCasesRegion = cumsum(cases))```
一种选择是从 GitHub 上包作者的项目中获取数据集(假设此数据按原样进入包)。
download.file("https://github.com/RamiKrispin/coronavirus/raw/master/data/coronavirus.rda", "cv")
load("cv")
似乎是最新的数据集:
max(coronavirus$date)
[1] "2020-03-04"
nrow(coronavirus)
[1] 2777
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.