簡體   English   中英

使用 ImputeTS 進行多變量時間序列預測?

[英]Multivariate Time series prediction with ImputeTS?

有什么方法可以使用imputeTS進行具有多個回歸變量的時間序列預測? 我在 y 中有空白,帶有 NA 的分鍾級數據,而我所有的 X(x1,x2,.. xn) 都是沒有 NA 的連續變量 ae

DateTime        Processed   Avg     1_Q   Median    3_Q

04/01/20 3:22       3       1.8      1      2       2.5
04/01/20 3:23       3       1.6      1      1       2
04/01/20 3:24       1       1.5      1      1       2
04/01/20 3:25       1       1.2      1      1       1
04/01/20 3:28       1       1.1      1      1       1
04/01/20 3:29       1       1.7      1      1.5     2.8
04/01/20 3:32       1       1.6      1      1       2
04/01/20 3:33       2       1.4      1      1       2
04/01/20 3:35       1       1.4      1      1       1.8
04/01/20 3:38               1.4      1      1       2
04/01/20 3:39       2       1.4      1      1       2
04/01/20 3:41               1.2      1      1       2
04/01/20 3:42               1.2      1      1       1.8
04/01/20 3:44       1       1.3      1      1       2
04/01/20 3:45       1       1.2      1      1       1
04/01/20 3:46       1       1.6      1      2       2
04/01/20 3:47       1       1.8      1      2       2
04/01/20 3:48               1.2      -      1       2
04/01/20 3:52               1.3      1      1       1.3
04/01/20 3:53       2       1.9      1      2       2
04/01/20 3:54       1       0.9      1      1       1
04/01/20 3:56       1       1.3      1      1       1
04/01/20 3:57       2       1.1      1      1       1

完整的數據集可以在這里找到

imputeTS非常適合時間序列插補(您可以及時使用一個變量的相關性)

在您的情況下,其他變量(變量間相關性)中有很多有用的信息。 imputeTS執行單變量時間序列插補,因此它只查看每個變量及其在時間上的相關性。

由於您的變量Avg1_QMedian3_Q似乎與Processed (您的缺失數據所在的位置)高度相關,因此另一個 package 可能是更好的選擇。 missForestimputeR和其他采用變量間相關性(但不是時間間相關性)的軟件包將是更好的選擇。

如果您想出自己的缺失數據插補程序,您可能會得到更好的結果。 丟失的數據似乎總是在Processed中,而AvgMedian3_Q似乎是關於Processed的統計數據。 也許例如總是使用四舍五入到最接近的數字的Avg作為已Processed的替代品已經相當不錯了。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM