簡體   English   中英

時間序列滯后特征提取

[英]Time Series Lag Features Extraction

嘗試使用移位 function 進行特征提取以創建 3 個附加列:上周同一天、上個月同一天、去年同一天。 我正在使用的數據可以在這里找到

最初,我試圖在創建新列之前只使用移位 function 。

data['timestamp'] = pd.to_datetime(data['timestamp'])
data['year'] = data['timestamp'].dt.year
data['month'] = data['timestamp'].dt.month
data['day'] = data['timestamp'].dt.day

data['day'] = pd.to_datetime(data['day'])
data.info()

the_7_days_diff = data['day'] - data.shift(freq='7D')['day']

收到錯誤“此方法僅適用於 DatetimeIndex、PeriodIndex 和 TimedeltaIndex;得到類型 RangeIndex”

任何幫助將不勝感激,以了解我做錯了什么。

該錯誤意味着shift應用於 dataframe 的索引,而不是值。 您需要在將timestamp列轉換為日期時間數據類型后將其設置為索引。

data['timestamp'] = pd.to_datetime(data['timestamp'])
data = data.set_index('timestamp')
week_diff = (data - data.shift(freq='7D')).dropna()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM