具有 3 個月數據集的多元時間序列預測

Question

我生成了 3 個月的數據（每一行對應於每一天），我想對其進行多變量時間序列分析：

可用的列是 -

Date    Capacity_booked Total_Bookings  Total_Searches  %Variation

每個日期在數據集中有 1 個條目，有 3 個月的數據，我想擬合一個多元時間序列 model 來預測其他變量。

到目前為止，這是我的嘗試，我試圖通過閱讀文章來達到同樣的目的。

我也這樣做了-

df['Date'] = pd.to_datetime(Date , format = '%d/%m/%Y')

data = df.drop(['Date'], axis=1)

data.index = df.Date

from statsmodels.tsa.vector_ar.vecm import coint_johansen
johan_test_temp = data
coint_johansen(johan_test_temp,-1,1).eig



#creating the train and validation set
train = data[:int(0.8*(len(data)))]
valid = data[int(0.8*(len(data))):]

freq=train.index.inferred_freq

from statsmodels.tsa.vector_ar.var_model import VAR

model = VAR(endog=train,freq=train.index.inferred_freq)
model_fit = model.fit()


# make prediction on validation
prediction = model_fit.forecast(model_fit.data, steps=len(valid))

cols = data.columns

pred = pd.DataFrame(index=range(0,len(prediction)),columns=[cols])
    for j in range(0,4):
        for i in range(0, len(prediction)):
           pred.iloc[i][j] = prediction[i][j]

我有一個驗證集和預測集。 然而，預測比預期的要糟糕得多。

數據集的圖是 - 1. % Variation