[英]What machine learning algorithm would be best suited for a scenario when you are not sure about the test features/attributes?
例如:對於培訓,您使用用戶填寫了表格中所有字段(大約40個字段)的數據以及預期的輸出。
現在我們建立一個模型(可以是人工神經網絡或SVM或邏輯回歸等)。
最后,用戶現在在表單中輸入3個字段,並期望進行預測。
在這種情況下,我可以使用的最佳ML算法是什么?
我認為這將取決於您的問題的具體情況。 您要根據哪種輸入來預測什么?
例如,像Netflix這樣的公司使用推薦系統來預測用戶對電影的收視率,例如基於非常稀疏的特征向量(用戶對目錄中所有電影的一小部分的現有收視率)。
另一種選擇是將一些映射算法從稀疏特征空間開發到公共潛伏空間,然后在該空間上使用SVM或神經網絡進行分類。 我相信本文做了類似的事情。 您也可以查看類似這樣的論文作為分類器,該分類器將來自兩個不同域的數據(例如,您的訓練vs.測試集,其中兩個都包含相似的信息,但是一個包含完整的數據,而另一個包含完整的數據)轉換為一個分類器。共同的潛在分類空間。 實際上,關於域無關的分類有很多東西。
查找關鍵字(帶有一些鏈接可以幫助您入門): 生成對抗網絡(GAN) , 領域對抗訓練 ,領域獨立分類,遷移學習。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.