[英]Linear Regression Model that improves as the user selects and trains data
我正在開發一個腳本來檢測來自生物源的信號數據的峰值。 我想創建一個半自動化的 model 來幫助預測哪些峰值是正確的。 該腳本得到改進,因為用戶手動選擇了其中一些峰值來幫助教導 model 哪些是正確的。
我試圖達到的工作流程是這樣的: 1. 用戶手動選擇數據 2. 腳本獲取正確的數據並將其放入 model 3. 使用 model 預測給定峰值的可能性是正確的。 4. 希望有足夠的數據和訓練,它可以自動運行通過 rest。
我也不知道一般主題的名稱,我正在努力尋找谷歌的內容。
我嘗試將其擬合到 scikit learn 中的線性回歸 model 中,但我沒有足夠的數據集(因為它從用戶的第一次干預中學習)。 我正在做的事情可能嗎?
很抱歉這個答案的籠統性,但 OP 要求提供一般性主題。
這聽起來像是半監督學習, 這里是 scikit-learn和這里更多細節可能有用。
沒有標記數據可以開始。 開始手動過程以獲取一些標記數據。 很快,半監督就可以開始並接管——通過一個過程來衡量其准確性。 適合您的情況,是一個很好的起點。
最終,您可能擁有“足夠”正確標記的數據,您可以研究擬合經典算法來預測余數。 “足夠”與問題的難度有關。 可能是幾十,幾百,幾千,...
根據您情況的其他細節,強化學習可能會起作用。 正如您所描述的情況,這可能行不通,但您的環境中可能還有其他細節可以利用這個系列。
警告詞——尤其是機器學習和半監督學習可能並不總是對每個問題都有效。 測量,測量,測量。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.