標簽[anomaly-detection] - 堆棧內存溢出

[英]ML model for machine failure prediction

我想開發一個 ML model 來預測機器故障之前的故障。我有一個來自機器各種傳感器（10 個傳感器）的時間序列數據集。在這個數據集中，我們有每次失敗前 10 天的數據集。我如何開始使用機器學習 model 和 python。我想要這個 model 將在故障發生前 1 天預測故障。請幫忙 ...

Kusto series_outliers() 如何計算異常分數？

[英]How does Kusto series_outliers() calculate anomaly scores?

有人可以解釋 series_outliers() Kusto function 如何計算異常分數嗎？我知道它使用帶有最小百分位數和最大百分位數的 Tukey 柵欄給定一個數字數組，但我想更詳細地了解步驟/算法是什么。例如，給定這張表我發現 Q1 = 2.4、Q3 = 15 和 IQR = 1 ...

是否可以編寫適用於整個項目中所有表的單個 dbt 測試？

[英]Is it possible to write a single dbt test which applies to all tables in the whole project?

為了確保新數據不間斷地不斷到達 Snowflake，我想在我的 dbt 項目中添加一些測試。我想在 Elementary 中使用 freshness_anomalies 測試，這是一個支持 dbt 的 package。我想不出一種只設置一次此測試以便在所有表上完成測試的方法。到目前為止我能做 ...

生產中的異常檢測

[英]Anomaly detection in production

我正在嘗試尋找建議和解決方案，但找不到任何建議和解決方案。閱讀博客后，我能夠使用 BigQuery ML (Arima Plus) 構建時間序列異常檢測。我的問題是：如何將這樣的 model 投入生產？可能我需要：每隔 X 天對 model 進行重新訓練每隔X小時檢查object表是否有新的 ...

時間序列中的異常值檢測

[英]Outlier detection in time-series

我有以下形式的數據集：我想在預測異常高值或低值的意義上執行異常檢測。我正在執行isolation forest ：我作為離群值得到的結果如下：它似乎識別了峰值，但它遺漏了一些顯然是異常值的低值，我在圖中突出顯示了它們。知道是什么導致了這個錯誤嗎？ ...

Pycaret 在數據塊筆記本上運行無監督異常檢測時拋出 KeyError: 'UNSUPERVISED_DUMMY_TARGET'

[英]Pycaret throwing KeyError: 'UNSUPERVISED_DUMMY_TARGET' while running unsupervised anomaly detection on databricks notebook

錯誤屏幕截圖我正在嘗試在 pycaret==2.3.5 中運行設置 function on python version 3.8.10 on databricks notebook 並顯示上述錯誤。相同的代碼在本地系統上運行良好，但在數據塊上運行不正常。任何人都可以幫忙嗎？我嘗試更改 pyc ...

異常檢測——檢測一個群體（但不是整個群體）的行為變化

[英]Anomaly Detection - detecting a change in behavior in one instance of a group (but not the group as a whole)

我一直在閱讀時間序列數據中的異常檢測，並理解如何使用它來跟蹤一個指標隨時間推移的概念。例如，假設我們想跟蹤一個人每天使用網站的時間（例如 John）。我們可以使用異常檢測來檢測 John 的數字何時顯着上升或下降。我們將使用的指標是“John 的網站每天點擊量”和日期。但是，假設我想對很多用 ...

FIlrer csv 表只有 2 列。 Python pandas PD.PD

[英]FIlrer csv table to have just 2 columns. Python pandas pd .pd

我得到了 csv 文件，其中包含如下行：我需要讓它們看起來像這樣：我的異常檢測代碼需要它，這樣我就不必手動刪除列等。至少不是全部。我無法使用與收集瓦數信息的機器配合使用的程序來做到這一點。我試過了，但它不夠用：它給出了這個 output： ...

如何將未知/看不見的數據歸類為異常

[英]How to classify unknown/unseen data as anomaly

我用 6 個不同的類別（標簽為 0-5）訓練了 CNN model，我得到了超過 90% 的准確率。它可以正確地分類類別。我實際上是在嘗試用它檢測異常。所以我想要的是，如果出現任何我的 model 以前從未見過或從未接受過類似數據訓練的數據，那么它將被歸類為異常。我沒有任何異常數據來訓練我的 ...

PyCaret Anomaly setup() 不工作（屬性錯誤）

[英]PyCaret Anomaly setup() is not working (ATTRIBUTE ERROR)

我正在嘗試按照教程在 PyCaret 中執行異常檢測。在運行 setup() 時，我不斷收到此錯誤： AttributeError: 'DataFrame' object 沒有屬性 'unique' 每當我在數據集中有分類變量時，就會發生此錯誤。以下是我使用的代碼和錯誤的屏幕截圖： ...

使用 Xgboost 算法對時間序列進行異常檢測

[英]Anomaly detection on time series with Xgboost algorithm

為什么 xgboost 算法對時間序列的異常檢測沒有用？有一些關於時間序列預測的案例。（ https://www.kaggle.com/code/robikscube/tutorial-time-series-forecasting-with-xgboost ）有沒有一種實現我們可以使用這個算 ...

ML.NET DetectSpikeBySSL 產生不正確的預測

[英]ML.NET DetectSpikeBySSL producing incorrect predictions

我正在使用 ML.NET 來檢測值列表中的峰值（帶有相應的日期）。據我了解，預測 output 是以下列表：大多數情況下，尖峰檢測效果很好，但在許多其他時候，我收到了不正確的預測，就好像輸入完全不同一樣。例如 - 在特定場景中，輸入值“2”得到以下預測：代碼：課程：由於這些錯誤的預測，我 ...

ValueError: 'c' 參數有 1000 個元素，與大小為 500 的 'x' 和 'y' 不一致

[英]ValueError: 'c' argument has 1000 elements, which is inconsistent with 'x' and 'y' with size 500

我正在研究語音數據的異常檢測。我用 LSTM 編寫的原始代碼，但我面臨着不平衡的數據集。所以我想從Pyod那里得到一些見解。在嘗試使用 Pyod 采樣數據時，我只是將他們的代碼復制並粘貼到我的 colab 中，但我遇到了錯誤，因為“ValueError：'c' 參數有 1000 個元素，這與大 ...

在 ML.NET 異常檢測中獲取時間戳

[英]Get Timestamp in ML.NET Anomaly detection

我正在關注本教程：使用 ML.NET 進行異常檢測，結果如下所示：但在我的數據中，我也有一個時間戳。是否可以在結果中看到時間戳？如果不可能，我如何使用結果？ ...

使用 dataframe 列對整個 dataframe 進行子集化，並按行應用 function（異常檢測）

[英]Use dataframe column to subset entire dataframe and apply function row-wise (anomaly detection)

假設我有一張這樣的桌子代碼鄰居 t_min abr007 abr018, abr030, abr032 16.2 abr018 abr007、abr030、laz246 20.9 abr030 abr007, abr032, cmp015 21.9 ... ... ... ...

在數千名用戶中檢測異常

[英]Detecting anomalies among several thousand users

我有這個問題，我記錄了我系統中所有用戶的每日條目（數千，甚至 100.000+）。這些條目有 3 個主要特征，“date”、“file_count”、“user_id”。日期文件計數用戶身份 2021-09- ...

在 Azure 尋找合適的服務

[英]Looking for suitable a service in Azure

我目前正在為我的副項目尋找 Azure 中的特定服務。我想構建一個實時服務，通過從 10 個月內收集的溫度時間序列數據中檢測異常值來向用戶發出警報或通知（Azure 雲中存在超過 5,000,000 個數據）取自很少的設備。 I've tried Anomaly Detector API , a ...

如何在 Prometheus 中提醒 z 分數

[英]How do I alert on z score in Prometheus

我有以下表達式：在 48 小時間隔內檢測異常。我正在努力理解如何編寫在檢測到異常時發出的警報。還是我完全錯了，這已經可以使用了，因為它會在檢測到異常時觸發？謝謝 ...

如何更改 x/y 軸的縮放以繪制熊貓數據框中的異常值？

[英]How to change scaling of x/y axis to plot outliers in pandas dataframe?

在我試圖在散點圖上繪制的一組數據點中，有幾個巨大的異常點。作為參考，大多數值的范圍在 0-100 之間，但偶爾會有 100000 的異常點。因此，當我在散點圖、箱線圖或任何圖上繪制圖表時，它會縮小很多以適應所有點，范圍在 0-100 之間的點中的 99% 看起來像一個小點。有什么辦法可以縮放它， ...

查找數百萬條記錄的異常

[英]Finding anomalies for millions of records

我有一個包含 4 列的數據庫（超過 2M 行）：個人電腦用戶日期數數 “計數”列是基於（PC + 用戶 + 日期）的匯總，即特定日期有多少特定用戶訪問特定計算機例如：個人電腦用戶日期數數一種一種 2020-01-01 5個一種一種 2020-01-02 8個一種 b 2020-02-04 ...