[英]Does R's Time-Series automatically generate missing data?
我想知道是否有人從stats軟件包中了解R的時間序列可以幫助我。
我目前正在使用stat的ts函數生成時間序列。
我向ts函數傳遞了一個數據集(每天包含3年的日期和數字值),開始和結束日期(已解析為十進制日期)以及365的頻率。但是,日期范圍缺失(例如,缺少2016年4月30日至2017年1月2日的日期和值)。
但是,當我查看或繪制時間序列時,我注意到丟失的數據會自動填充值。
我不確定這些值是如何生成的。
時間序列功能是否會自動使用其數據填寫缺失的日期?
謝謝你的幫助,
周傑倫
編輯:我原始數據框架的一部分的示例:
(您會發現從2016-04-30到2017-01-02缺少數據)
Dataframe:
date pieceVolume
... | ... | ...
615 | 2016-04-29 | 250.5
616 | 2016-04-30 | 1230.4
617 | 2017-01-02 | 273.2
618 | 2017-01-01 | 26150.5
619 | 2017-01-02 | 232550.7
我的原始數據幀有655行,但是我的時間序列的長度為1079。
這就是我從數據幀生成時間序列的方式:
sts <- ts(test_data$pieceVolume, start=decimal_date(min(as.Date(test_data$date))), end=decimal_date(max(as.Date(test_data$date))), frequency=365)
我的原始代碼:
original_data <- readRDS("original_data.rds")
library(plyr)
## Using ddply to average all the pieceVolumes that have the same dates.
test_data <- plyr::ddply(original_data, .(date), function(x) c(pieceVolume=mean(x$pieceVolume)))
library("forecast")
## Generate time-series using test_data
sts <- ts(test_data$pieceVolume, start=decimal_date(min(as.Date(test_data$date))), end=decimal_date(max(as.Date(test_data$date))), frequency=365)
嘗試
sts<- ts(test_data$pieceVolume)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.