簡體 English 中英

機器學習，最佳技術

[英]Machine learning, best technique

原文 2011-03-26 15:56:31 3 8 artificial-intelligence/ machine-learning/ svm

我是機器學習的新手。 我熟悉 SVM、神經網絡和 GA。 我想知道學習對圖片和音頻進行分類的最佳技術。 SVM 做得不錯，但需要很多時間。 有人知道更快更好的嗎？ 另外我想知道 SVM 最快的庫。

8 個解決方案

你的問題很好，並且與分類算法的最新技術有關，正如你所說，分類器的選擇取決於你的數據，在圖像的情況下，我可以告訴你，有一種方法叫阿達-升壓型，閱讀這和這更多地了解它，在另一方面，你可以找到很多人都在做一些researh，例如面孔基於AdaBoost的性別分類 [羅德里戈Verschae，哈維爾·魯伊斯-德爾-太陽能和Mauricio Correa]他們說：

“Adaboost-mLBP優於所有其他基於Adaboost的方法，以及基線方法（SVM，PCA和PCA + SVM）”看看它。

如果您主要關心的是速度，那么您應該看看大眾，通常是基於隨機梯度下降的算法來訓練SVM。

如果特征數量與訓練樣本的數量相比較大那么你應該進行邏輯回歸或沒有內核的SVM

如果特征的數量很少而且訓練樣例的數量是中間的那么你應該使用SVN和高斯核

功能的數量很少，訓練樣例的數量很大，使用邏輯回歸或沒有內核的SVM。

那是根據斯坦福ML級。

該方法主要取決於手頭的問題。 對於任何問題，沒有任何方法總是最快的。 話雖如此，你還應該記住，一旦你選擇了速度算法，你就會開始在准確性上妥協。

例如，由於您嘗試對圖像進行分類，因此與手頭的訓練樣本數量相比，可能會有許多功能。 在這種情況下，如果你使用內核進行SVM，你最終可能會因為方差太高而過度擬合。 因此，您可能希望選擇具有高偏差和低方差的方法。 使用邏輯回歸或線性SVM是一些方法。

您還可以使用不同類型的正則化或技術（如SVD）來刪除對輸出預測沒有多大貢獻的功能，並且只有最重要的功能。 換句話說，選擇它們之間幾乎沒有相關性的特征。 一旦你這樣做，你就可以在不犧牲准確性的情況下加速你的SVM算法。

希望能幫助到你。

對於此類任務，您可能需要先提取功能。 只有在分類后才可行。

我認為特征提取和選擇很重要。

對於圖像分類，有很多功能，如原始像素， SIFT特征，顏色，紋理等。 最好選擇一些適合你的任務。

我不熟悉音頻分類，但可能會有一些頻譜特征，比如信號的傅立葉變換MFCC 。

用於分類的方法也很重要。 除了問題中的方法，KNN也是一個合理的選擇。

實際上，使用什么特征和方法與任務密切相關。

在學習機器方面有一些很好的技巧，如助推器和adaboost。 一種分類方法是增強方法。 該方法將迭代地操縱數據，然后在每次迭代時由特定的基礎分類器對其進行分類，這反過來將構建分類模型。 Boosting在每次迭代中使用每個數據的加權，其權重值將根據要分類的數據的難度級別而改變。 雖然方法adaBoost是一種通過使用損失函數指數函數來提高預測精度的一種保證技術。