簡體   English   中英

關於環境聲音分類的分類方法和機器學習模型的建議

[英]Suggestion on Classification Method and Machine Learning Model for Environment Sound Classification

我目前對環境聲音分類有疑問。 我想使用“音頻分類”來檢測特定類型的串音(確實有很大不同,而且很容易被人耳區分)。 但是還有其他可能發生的串音對我來說並不重要,即我所需要的只是不將它們歸類為“特定類型的串音”。

我現在嘗試使用GMM&LFCC進行分類。 所有LFCC都從該類型的串音中訓練出一個GMM模型,所有其他LFCC(從某種非碰撞環境中發出的聲音,或者從我不想要的其他某種類型的碰撞中)得到一個GMM模型。 當前的性能非常差,召回率很高,但精度卻非常低。 我發現,雖然我的“特定聲音類型”的GMM模型在沒有發生聲音類型時會給出非常低的概率,但是如果我想要的聲音以外的其他所有聲音的另一種GMM模型也會給出低概率這就是所有其他類型的碰撞正在發生的情況。

對於這種情況,我應該切換到其他模型,例如ANN或SVM,還是需要添加更多的GMM模型? 例如,我在考慮將GMM_1用於所需的碰撞類型,將GMM_2用於其他類型的碰撞,將GMM_3用於其他類型的碰撞。 但是我很難獲得“所有其他類型的碰撞”,而且我不確定這種方式是否確實會提高准確性。

好吧,我必須回答我自己的問題。 這些天,我以我在問題中提到的方式使用具有三個GMM的模型進行了一些測試。 它仍然可以正常工作。 如果我有更多的訓練數據,我有信心可以達到90%以上的准確性。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM