繁体   English   中英

如何自动刷新 R 包中的数据源? 特别是冠状病毒CRAN包数据

[英]How can I refresh a data source from an R package automatically? Specifically the coronavirus CRAN package data

我正在使用约翰霍普金斯冠状病毒 R 包,但我还没有想出如何让它每天为我提供底层更新数据。 我已经重新启动了 R 并重新加载了包,但从我安装包时开始,数据似乎是静态的。 除非我重新安装软件包,否则每次运行它时它都不会提供更新的数据。 这个包背后的数据每晚都会在存储库上更新。 我正试图找出一种让我的每天更新的好方法。

在此先感谢您提供的任何帮助!


library(coronavirus) 
library(dplyr)

data("coronavirus")

summary_df <- coronavirus %>% group_by(Country.Region, type) %>%
  summarise(total_cases = sum(cases)) %>%
  arrange(-total_cases)
df <- coronavirus %>%
  group_by(Province.State,Country.Region,Lat,Long,type) %>%
  mutate(TotalCasesRegion = cumsum(cases))```

一种选择是从 GitHub 上包作者的项目中获取数据集(假设此数据按原样进入包)。

download.file("https://github.com/RamiKrispin/coronavirus/raw/master/data/coronavirus.rda", "cv")
load("cv")

似乎是最新的数据集:

max(coronavirus$date)
[1] "2020-03-04"

nrow(coronavirus)
[1] 2777

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM