簡體   English   中英

在iOS上使用OpenEars會由於背景噪音而導致識別不佳

[英]Poor recognition due to background noise using OpenEars on iOS

我在應用程序中使用OpenEars執行某些單詞和句子的識別。 我遵循了離線語音識別的基本教程,並在Swift中進行了移植。 這是設置步驟

self.openEarsEventsObserver = OEEventsObserver()
self.openEarsEventsObserver.delegate = self
let lmGenerator: OELanguageModelGenerator = OELanguageModelGenerator()
addWords()
let name = "LanguageModelFileStarSaver"
lmGenerator.generateLanguageModelFromArray(words, withFilesNamed: name, forAcousticModelAtPath: OEAcousticModel.pathToModel("AcousticModelEnglish"))
lmPath = lmGenerator.pathToSuccessfullyGeneratedLanguageModelWithRequestedName(name)
dicPath = lmGenerator.pathToSuccessfullyGeneratedDictionaryWithRequestedName(name)

在單個單詞和整個句子的安靜房間中,識別效果都很好(我想說它的命中率是90%)。 但是,當我在安靜的酒吧中嘗試使用淺背景噪音時,該應用甚至在識別單詞時都遇到了嚴重困難。 有背景噪音時,有什么方法可以改善語音識別能力?

如果背景噪聲或多或少是均勻的(即具有規則的模式),則可以嘗試修改聲學模型 ,否則這是一個開放性問題,有時稱為雞尾酒會效果可以使用DNN 來部分解決

嘗試此設置,對我來說效果很好。

try? OEPocketsphinxController.sharedInstance().setActive(true)
OEPocketsphinxController.sharedInstance().secondsOfSilenceToDetect = 2
OEPocketsphinxController.sharedInstance().setSecondsOfSilence()
OEPocketsphinxController.sharedInstance().vadThreshold = 3.5
OEPocketsphinxController.sharedInstance().removingNoise = true

或者,您可以嘗試使用iSphinx庫。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM