簡體   English   中英

當您不確定測試功能/屬性時,哪種機器學習算法最適合場景?

[英]What machine learning algorithm would be best suited for a scenario when you are not sure about the test features/attributes?

例如:對於培訓,您使用用戶填寫了表格中所有字段(大約40個字段)的數據以及預期的輸出。

現在我們建立一個模型(可以是人工神經網絡或SVM或邏輯回歸等)。

最后,用戶現在在表單中輸入3個字段,並期望進行預測。

在這種情況下,我可以使用的最佳ML算法是什么?

我認為這將取決於您的問題的具體情況。 您要根據哪種輸入來預測什么?

例如,像Netflix這樣的公司使用推薦系統來預測用戶對電影的收視率,例如基於非常稀疏的特征向量(用戶對目錄中所有電影的一小部分的現有收視率)。

另一種選擇是將一些映射算法從稀疏特征空間開發到公共潛伏空間,然后在該空間上使用SVM或神經網絡進行分類。 我相信本文做了類似的事情。 您也可以查看類似這樣的論文作為分類器,該分類器將來自兩個不同域的數據(例如,您的訓練vs.測試集,其中兩個都包含相似的信息,但是一個包含完整的數據,而另一個包含完整的數據)轉換為一個分類器。共同的潛在分類空間。 實際上,關於域無關的分類有很多東西。

查找關鍵字(帶有一些鏈接可以幫助您入門): 生成對抗網絡(GAN)領域對抗訓練 ,領域獨立分類,遷移學習。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM