簡體 English 中英

關於環境聲音分類的分類方法和機器學習模型的建議

[英]Suggestion on Classification Method and Machine Learning Model for Environment Sound Classification

原文 2014-05-14 14:58:48 9 1 audio/ machine-learning/ classification/ audio-processing

我目前對環境聲音分類有疑問。 我想使用“音頻分類”來檢測特定類型的串音（確實有很大不同，而且很容易被人耳區分）。 但是還有其他可能發生的串音對我來說並不重要，即我所需要的只是不將它們歸類為“特定類型的串音”。

我現在嘗試使用GMM＆LFCC進行分類。 所有LFCC都從該類型的串音中訓練出一個GMM模型，所有其他LFCC（從某種非碰撞環境中發出的聲音，或者從我不想要的其他某種類型的碰撞中）得到一個GMM模型。 當前的性能非常差，召回率很高，但精度卻非常低。 我發現，雖然我的“特定聲音類型”的GMM模型在沒有發生聲音類型時會給出非常低的概率，但是如果我想要的聲音以外的其他所有聲音的另一種GMM模型也會給出低概率這就是所有其他類型的碰撞正在發生的情況。

對於這種情況，我應該切換到其他模型，例如ANN或SVM，還是需要添加更多的GMM模型？ 例如，我在考慮將GMM_1用於所需的碰撞類型，將GMM_2用於其他類型的碰撞，將GMM_3用於其他類型的碰撞。 但是我很難獲得“所有其他類型的碰撞”，而且我不確定這種方式是否確實會提高准確性。

1 個解決方案

好吧，我必須回答我自己的問題。 這些天，我以我在問題中提到的方式使用具有三個GMM的模型進行了一些測試。 它仍然可以正常工作。 如果我有更多的訓練數據，我有信心可以達到90％以上的准確性。

遷移學習音頻分類

[英]Transfer Learning Audio classification

用python機器學習識別聲音（單詞）

[英]Recognition of a sound (a word) with machine learning in python

如何在圖像分類 swift 上運行 tflite model

[英]How to run tflite model not on image classification swift

我應該使用哪種算法進行信號（聲音）分類？

[英]Which algorithm should I use for signal (sound) one class classification?

算法建議：比較聲音片段

[英]Algorithm suggestion: comparing sound clips

用於特征提取的 Ya.net 音頻分類

[英]Yamnet audio classification for feature extraction

使用librosa進行音頻分類的MFCC特征描述符

[英]MFCC feature descriptors for audio classification using librosa

獲取新音頻文件的分類概率？

[英]Getting classification probability for new audio files?

與Keras的音頻分類：人聲的存在

[英]Audio classification with Keras: presence of human voice

如何處理不同的音頻格式進行音頻分類？

[英]How to deal with different audio formats for audio classification?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 遷移學習音頻分類用python機器學習識別聲音（單詞）如何在圖像分類 swift 上運行 tflite model 我應該使用哪種算法進行信號（聲音）分類？算法建議：比較聲音片段用於特征提取的 Ya.net 音頻分類使用librosa進行音頻分類的MFCC特征描述符獲取新音頻文件的分類概率？與Keras的音頻分類：人聲的存在如何處理不同的音頻格式進行音頻分類？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM