![](/img/trans.png)
[英]Fast way to find k nearest neighbors from only past, in R?
假設我有一個包含 10,000 行和 8 列的數字數據。 我想使用歐幾里德距離獲得每一行的前 k 個鄰居(跳過前 1,000 行),但問題是每一行我只對前幾行感興趣。 (例如,對於第 2001 行,我只搜索前 2000 行)。 更改每一行的引用太慢了。 我能寫的最快的 function 是使用 ...
[英]Fast way to find k nearest neighbors from only past, in R?
假設我有一個包含 10,000 行和 8 列的數字數據。 我想使用歐幾里德距離獲得每一行的前 k 個鄰居(跳過前 1,000 行),但問題是每一行我只對前幾行感興趣。 (例如,對於第 2001 行,我只搜索前 2000 行)。 更改每一行的引用太慢了。 我能寫的最快的 function 是使用 ...
[英]Time series data
我有一個 Excel 文件,里面有兩列,我想合並它們,但其中一列是日期時間形式,另一列是 object(實際上是時間)。 我想要做的是將 object 轉換為日期時間格式。 在此處輸入圖像描述我已經嘗試了所有我能想到的方法,但我一直收到錯誤消息。 編輯:在此處輸入圖片描述 import pandas ...
[英]How to train an LSTM model on multiple smaller individual datasets?
我有 11000 個數據集,每個數據集有 52 個條目,對應 52 周的數據。 我想在所有這些 11000 個數據集上訓練一個 LSTM model,因為我覺得在單個數據集上單獨訓練數據,並且考慮到每個數據集只有 52 個條目,對每個數據集進行預測不會提供很好的 model。 它也可能無法涵蓋所有 ...
[英]How to run Time Series Regression with years, countries, and multiple values in R?
我想我知道我需要做什么,我只是不知道如何讓它發揮作用。 數據示例:數據我在 Excel 中有這種格式的數十年數據,我將其上傳到 R。我相信我需要以某種方式將其轉換為時間序列或日期格式,但將國家/地區保留為類別,以便我可以運行以下回歸: 任何人都可以共享可以幫助我完成此任務的代碼/程序包嗎? 感覺很 ...
[英]Multivariate multi-step time forecasting bad prediction results PyTorch LSTM Seq2Seq
我正在嘗試在 PyTorch 中構建基於 LSTM 的 Seq2Seq model 以進行多變量多步預測。 數據使用的數據如上圖所示,其中最后一列是目標,前面的列都是特征。 對於預處理,我使用 MaxMinScaler 在 -1 和 1 之間縮放所有數據。 特點和目標然后我使用了編碼器-解碼器結構 ...
[英]How to plot in time series with ggplot, geom_line, with line group by 'answer'
我繪制了包含三個變量的時間序列數據:日期、答案和計數。 我想 plot 在時間序列中代表答案類別的線條。 我在下面嘗試過這段代碼,但結果並不如預期:我沒有得到任何線路。 有人可以幫忙嗎? 然后,我將答案值更改為數字,其中“同意”= 1、“不同意”= 2、“不知道”= 3,並運行相同的代碼,得到類 ...
[英]interpret plot of multivariate time series clustering results from dtwclust
我在 r 中使用 DTWCLUST package 進行多變量時間序列聚類。 這是我的代碼。 CharTrajMV 數據集包含 3 個變量的 100 個觀測值。 據我了解,集群是根據 3 個變量確定的,而不是單變量時間序列聚類。 每個集群圖顯示了屬於該集群的幾個類似模式的時間序列(觀察)。 這個 ...
[英]Rbeast Time Series - Weird Time Axis In Plot
我正在調查新南威爾士州地區的環境空氣污染,並使用 Rbeast 進行每日時間序列分解分析,以調查在 Covid-19 封鎖期間是否存在變化點特征。 我創建了一個循環代碼來分析每個區域內每種污染物的數據 - 但是 Beast X 軸(“日期” - 即 01-01-2021 - 理想情況下會繪制年份( ...
[英]How to predict time series with limited data
我有一個包含四列的數據集:日期、類別、產品、比率(%)。 我希望能夠預測我數據中每種產品的費率。 我遇到的主要問題是,由於產品不斷停產,某些產品的歷史數據很少,因此難以預測。 我在網上讀到有類似問題的人使用貝葉斯層次模型,比如 Numpyro 的這個例子: 但是我在網上找到的每個示例都只顯示了在 ...
[英]curve_fit multivariable arrays non-linear regression
我正在嘗試使用 curve_fit 擬合多元 function 的系數。 所有變量均為 arrays,形狀如下:(1000,) 手動我可以按如下方式擬合曲線。 首先,我定義我的 function,其中變量 = [dphi1,dphi2,phi1,phi2,M] 和系數 = [c1,c2,c3,c4, ...
[英]LSTM multivariate predicting multiple features
我是這個神經網絡和 LSTM 的新手。 我希望我能得到你的指導,我會感謝你。 我有 2 年的比特幣歷史數據集和比特幣情緒數據集,間隔為一小時。 我的目標是使用 LSTM 預測未來 60 小時的圖表。 我看過一些關於多元時間序列預測的文章。 但在所有這些中,他們只使用一個特征進行預測。 他們只預測 ...
[英]How to pass test independent variables as parameters to time series forecasting
嗨,我需要幫助我是時間序列的新手,我正在設計一個多元時間序列實驗。 我的數據集如下所示:date x1 x2 x3 x4 x5 y,其中 date 是日期索引,x1...xn 是外生變量,y 是固定數據。 在這種情況下,我有熱編碼的分類變量,所以我的 dataframe 是這樣的: date x1 ...
[英]r - Plotting monthly time series data in R - cannot plot more than 10 series
我在 R Studio 中繪制時間序列數據時遇到了很多麻煩。 我的數據布局如下: TSF 當我嘗試將基本代碼寫入 plot 時,我得到以下數據 我的數據是每月的,因此 12 個月超過了 10 個圖表的明顯限制。我已經能夠通過排除兩個月來制作一些 plot 但這對我來說不切實際。 我看過很多關於這個 ...
[英]how to combine logistic and poisson in a multivariate model
如何在一個 model 中同時使用邏輯回歸和泊松回歸方法編寫多元零膨脹 model? 結果應如下所示: 在本文中,這是由 SAS9.3 中的 PROC NLMIXED 完成的。 我如何使用 r 中的 glmmTMB package 執行此操作? ...
[英]AttributeError: 'Optimization' object has no attribute 'train'. When trying to implement multivariate time series
我正在嘗試使用 pytorch 實現多變量時間序列。這里我只給出出現錯誤的那部分代碼,不過我已經在我的完整代碼中包含了所有提到的類。 代碼引用自https://towardsdatascience.com/building-rnn-lstm-and-gru-for-time-series-using ...
[英]R time series or data outliers
有具有多個異常值的數據,我想更正它以進行預測,因為我知道我的值通常在 1 到 4 之間。因為我必須在不觸及正常值(1 到 4 之間)的情況下獲取這些值。 謝謝交通日期 107 01/02/2020 60 01/03/2020 3.4 01/04/2020 3.2 01/05/2020 ...
[英]Problems with inverse_transform scaled predictions and y_test in multi-step, multi-variate LSTM
我已經建立了一個多步驟、多變量的 LSTM 模型來預測未來 5 天的目標變量,並進行 5 天的回顧。 該模型運行平穩(即使它必須進一步改進),但是一旦我得到我的預測,我就無法正確地反轉應用的轉換。 我在網上看到有很多方法可以預處理和轉換數據。 我決定按照以下步驟操作: 數據獲取和清理 數 ...