簡體   English   中英

如何在沒有數據的情況下設置機器學習 model

[英]How to set up a machine learning model with no data

我知道你在想什么。 這是一個愚蠢的問題。 我也這么認為,但我們公司還很年輕,幾乎沒有任何數據可以訓練 model。 我被分配只設置一個 model 基礎設施來接受輸入和 output 決策(現在不必准確)。 基礎設施到位后,我們將研究收集或購買數據以通過 model 提供數據。

在我看來,這個過程有點落后,但這是我老板想要的方式,所以我必須交付。

我的目標是為一組特征構建機器學習 model(隨機森林、增強、邏輯回歸等),如下所示: - 目標:二進制 - 特征:A(二進制),B(4 類分類),C (數字),D(二進制)

由於我沒有訓練數據,我無法遵循拆分訓練/測試、擬合、交叉驗證並達到最佳 model 的傳統路線。 我如何在不訓練的情況下簡單地獲得具有虛擬系數的 model? 然后,我會將 ML model 序列化為一個 pickle 文件,以將其插入 Flask 應用程序以做出決定。 多謝你們!

即使你有一個小數據集,你也可以使用過采樣來豐富它——甚至構建一個 model。 當然,這個 model 不會很有預測性 - 但您會隨着時間的推移繼續訓練它。 請注意,過采樣和稍后使用交叉驗證會使您過度擬合 - 所以當您看到結果時不要太興奮......

在此處查看如何使用過采樣。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM