簡體   English   中英

線性回歸 Model 隨着用戶選擇和訓練數據而改進

[英]Linear Regression Model that improves as the user selects and trains data

我正在開發一個腳本來檢測來自生物源的信號數據的峰值。 我想創建一個半自動化的 model 來幫助預測哪些峰值是正確的。 該腳本得到改進,因為用戶手動選擇了其中一些峰值來幫助教導 model 哪些是正確的。

我試圖達到的工作流程是這樣的: 1. 用戶手動選擇數據 2. 腳本獲取正確的數據並將其放入 model 3. 使用 model 預測給定峰值的可能性是正確的。 4. 希望有足夠的數據和訓練,它可以自動運行通過 rest。

我也不知道一般主題的名稱,我正在努力尋找谷歌的內容。

我嘗試將其擬合到 scikit learn 中的線性回歸 model 中,但我沒有足夠的數據集(因為它從用戶的第一次干預中學習)。 我正在做的事情可能嗎?

很抱歉這個答案的籠統性,但 OP 要求提供一般性主題。

這聽起來像是半監督學習這里是 scikit-learn這里更多細節可能有用。

沒有標記數據可以開始。 開始手動過程以獲取一些標記數據。 很快,半監督就可以開始並接管——通過一個過程來衡量其准確性。 適合您的情況,是一個很好的起點。

最終,您可能擁有“足夠”正確標記的數據,您可以研究擬合經典算法來預測余數。 “足夠”與問題的難度有關。 可能是幾十,幾百,幾千,...

根據您情況的其他細節,強化學習可能會起作用。 正如您所描述的情況,這可能行不通,但您的環境中可能還有其他細節可以利用這個系列。

警告詞——尤其是機器學習和半監督學習可能並不總是對每個問題都有效。 測量,測量,測量。

謝謝大家的幫助。 我正在和一位同事交談,他將我推薦給在線機器學習 我想這就是我要找的那個。 雖然我不會處理時間序列數據或來自在線的流式數據,但我認為該方法足以滿足我的需求。 這種方法允許一個一個地訓練數據,而不是批量訓練。 我認為 SciKit Learn 目前不具備開箱即用的在線機器學習能力。

我認為很好地概括了在線機器學習的優勢(還展示了 creme python 庫)。

再次感謝!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM