簡體   English   中英

在 ARIMA 中搜索最優參數?

[英]Search for optimal parameters in ARIMA?

我正在學習時間序列預測。 ARIMA model 具有三個參數:AR 滯后、積分順序和 MA 滯后。

我正在學習這門課程,他們只是通過嘗試(添加滯后)不同的模型並檢查它是否增加對數似然和減少信息標准來估計最佳參數。 看起來很行人。

是否有一個流程可以運行,您可以在其中搜索最佳參數。 諸如超參數調整之類的東西? 如果沒有其他選擇,我正在考慮調整 sklearn 的 GridSearch。

有兩種可能:

1.您可以使用自相關(ACF)和偏自相關(PACF)。

自相關顯示了過去觀察(滯后)與時間序列的相關性,即時間序列與自身的相關性。 如果你有一個時間序列 y(t),那么你計算 y(t) 和 y(t-1)、y(t) 和 y(t-2) 的相關性,等等。

自相關的問題在於,所謂的中間效應/間接相關也包括在內。 如果 y(t) 和 y(t-1) 相關,並且 y(t-1) 和 y(t-2) 也相關。 這會間接影響 y(t) 和 y(t-2) 的相關性。 你可以在這里找到更詳細的解釋:

https://otexts.com/fpp2/non-seasonal-arima.html

偏自相關還顯示了時間序列的相關性及其滯后,但消除了中間效應。 這意味着在 PACF 中,您只能看到 y(t) 如何直接受 y(t-1)、y(t-2) 等影響。 也許也看看這里:

https://towardsdatascience.com/time-series-from-scratch-autocorrelation-and-partial-autocorrelation-explained-1dd641e3076f

有許多經驗法則可以解釋這些情節。 我推薦以下內容:

如果 ACF 下降,請使用 MA model 與 PACF 的顯着和強相關性。

如果 PACF 下降,請使用與 ACF 的顯着和強相關性的 AR model。

你也可以在這里看看:

https://towardsdatascience.com/identifying-ar-and-ma-terms-using-acf-and-pacf-plots-in-time-series-forecasting-ccb9fd073db8

2.你可以使用auto_arima()

package pmd 提供 function auto_arima()以自動找到最佳參數。 您需要自己找到 d 和 D,但它可以為 p、P、q 和 Q 找到好的參數。它將不同的模型與 AIC 進行比較以找到最佳擬合。 請記住,它不是 100% 可靠的,您需要自己處理平穩性。 簡而言之,您可以像這樣使用它:

from pmdarima.arima import auto_arima
    
auto_arima(y=your_data,
           seasonal=True/False, 
           m=season_length, #only if seasonal=True
           trace=True #so that you can see what is happening.
)

有關更多詳細信息,請檢查以下內容:

https://alkaline-ml.com/pmdarima/tips_and_tricks.html

https://alkaline-ml.com/pmdarima/modules/generated/pmdarima.arima.auto_arima.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM