簡體   English   中英

R - 預測多個時間序列(15K 產品)

[英]R - Forecast multiple time-series (15K Products)

嗨堆棧溢出社區。

我有超過 15K 種產品的 5 年每周價格數據(5*15K**52 條記錄)。 每個產品都是一個單變量時間序列。 目標是預測每種產品的價格。

我熟悉單變量時間序列分析,我們可以在其中可視化每個 ts 序列,繪制其 ACF、PACF 並預測該序列。 但是,單變量時間序列分析在這種情況下是不可能的,因為我有 15K 個不同的時間序列,無法可視化每個時間序列、其 ACF、PACF 和每個產品的單獨預測,並對其進行調整/決定。

我正在尋找一些建議和方向來使用 R(最好)解決這個多系列預測問題。 任何幫助和支持將不勝感激。

提前致謝。

我建議您使用forecast包中的auto.arima

這樣您就不必搜索正確的 ARIMA 模型。

auto.arima:根據 AIC、AICc 或 BIC 值返回最佳 ARIMA 模型。 該函數在提供的順序約束內對可能的模型進行搜索。

fit <- auto.arima(WWWusage)
plot(forecast(fit,h=20))

您可以放置​​一個時間序列,而不是 WWWusage,以適合 ARIMA 模型。 使用forecast您然后執行預測 - 在這種情況下提前 20 個時間步 ( h=20 )。

auto.arima 基本上為您選擇 ARIMA 參數(根據 AIC - Akaike 信息准則)。

如果對您來說計算成本太高,您將不得不嘗試。 但總的來說,預測這么多時間序列並不少見。

要記住的另一件事可能是,畢竟這可能不是那么不可能,時間序列中存在一些互相關。 因此,從預測精度的角度來看,不將其視為單變量預測問題是有意義的。

它的設置聽起來與最近在 Kaggle 上舉行的m5 預測競賽非常相似。 目標是預測沃爾瑪在美國銷售的各種產品的單位銷售額。

所以很多時間序列的銷售數據來預測。 在這種情況下,獲勝者沒有進行單變量預測。 這里有一個鏈接到獲勝解決方案的描述。 由於設置看起來與您的非常相似,因此在此挑戰的 kaggle 論壇中閱讀一些內容可能是有意義的 - 甚至可能有有用的筆記本(代碼示例)可用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM