[英]Multivariate Time series prediction with ImputeTS?
有什么方法可以使用imputeTS進行具有多個回歸變量的時間序列預測? 我在 y 中有空白,帶有 NA 的分鍾級數據,而我所有的 X(x1,x2,.. xn) 都是沒有 NA 的連續變量 ae
DateTime Processed Avg 1_Q Median 3_Q
04/01/20 3:22 3 1.8 1 2 2.5
04/01/20 3:23 3 1.6 1 1 2
04/01/20 3:24 1 1.5 1 1 2
04/01/20 3:25 1 1.2 1 1 1
04/01/20 3:28 1 1.1 1 1 1
04/01/20 3:29 1 1.7 1 1.5 2.8
04/01/20 3:32 1 1.6 1 1 2
04/01/20 3:33 2 1.4 1 1 2
04/01/20 3:35 1 1.4 1 1 1.8
04/01/20 3:38 1.4 1 1 2
04/01/20 3:39 2 1.4 1 1 2
04/01/20 3:41 1.2 1 1 2
04/01/20 3:42 1.2 1 1 1.8
04/01/20 3:44 1 1.3 1 1 2
04/01/20 3:45 1 1.2 1 1 1
04/01/20 3:46 1 1.6 1 2 2
04/01/20 3:47 1 1.8 1 2 2
04/01/20 3:48 1.2 - 1 2
04/01/20 3:52 1.3 1 1 1.3
04/01/20 3:53 2 1.9 1 2 2
04/01/20 3:54 1 0.9 1 1 1
04/01/20 3:56 1 1.3 1 1 1
04/01/20 3:57 2 1.1 1 1 1
完整的數據集可以在這里找到
imputeTS非常適合時間序列插補(您可以及時使用一個變量的相關性)
在您的情況下,其他變量(變量間相關性)中有很多有用的信息。 imputeTS執行單變量時間序列插補,因此它只查看每個變量及其在時間上的相關性。
由於您的變量Avg
、 1_Q
、 Median
、 3_Q
似乎與Processed
(您的缺失數據所在的位置)高度相關,因此另一個 package 可能是更好的選擇。 missForest , imputeR和其他采用變量間相關性(但不是時間間相關性)的軟件包將是更好的選擇。
如果您想出自己的缺失數據插補程序,您可能會得到更好的結果。 丟失的數據似乎總是在Processed
中,而Avg
、 Median
、 3_Q
似乎是關於Processed
的統計數據。 也許例如總是使用四舍五入到最接近的數字的Avg
作為已Processed
的替代品已經相當不錯了。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.