簡體   English   中英

時間序列 - 相關和滯后時間

[英]Time series - correlation and lag time

我正在研究一組輸入變量和響應變量price之間的相關性。 這些都是時間序列。

1)是否有必要平滑輸入變量為周期性(自回歸) 的曲線 如果是這樣,怎么樣?

2)一旦建立了相關性,我想准確量化輸入變量如何影響響​​應變量。 例如:“一旦X增加> 10%,那么6個月后y增加2%。”

我應該考慮哪些python庫來實現這一點 - 特別是要弄清楚兩個相關事件之間的滯后時間

例: 在此輸入圖像描述

我已經看過: statsmodels.tsa.ARMA但它似乎只能預測一個變量。 scipy中 ,協方差矩陣可以告訴我相關性,但無助於計算延遲時間。

雖然問題的一部分是基於更多的統計數據,但有關如何在Python中執行此操作的內容似乎在這里。 我看到你已經決定在R中通過查看關於Cross Validated的問題來做這個,但是如果你決定回到Python,或者為了其他人發現這個問題的利益:

我認為你在正確的區域看statsmodels.tsa,但它還有很多東西,而不僅僅是ARMA包:

http://statsmodels.sourceforge.net/devel/tsa.html

特別是,請查看statsmodels.tsa.vector_ar以建模多變量時間序列。 它的文檔可在此處獲得:

http://statsmodels.sourceforge.net/devel/vector_ar.html


上面的頁面指出它是用於處理固定時間序列 - 我認為這意味着刪除趨勢和任何季節性或周期性。 以下鏈接最終准備好預測模型,但它討論了用於構建模型的Box-Jenkins方法,包括使其靜止:

http://www.colorado.edu/geography/class_homepages/geog_4023_s11/Lecture16_TS3.pdf

你會注意到該鏈接討論了尋找自相關(ACF)和部分自相關(PACF),然后使用Augmented Dickey-Fuller測試來測試該系列是否現在是靜止的。 這三種工具都可以在statsmodels.tsa.stattools中找到。 同樣,statsmodels.tsa.arma_process有ACF和PACF。

上述鏈接還討論了使用像AIC這樣的指標來確定最佳模型; statsmodels.tsa.var_model和statsmodels.tsa.ar_model都包括AIC(以及其他措施)。 使用select_order,似乎使用相同的度量來計算var_model中的滯后順序。


此外,pandas庫至少部分集成到statsmodels中,並且本身具有大量的時間序列和數據分析功能,因此可能會引起人們的興趣。 時間序列文檔位於:

http://pandas.pydata.org/pandas-docs/stable/timeseries.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM