在iOS上使用OpenEars會由於背景噪音而導致識別不佳

Question

我在應用程序中使用OpenEars執行某些單詞和句子的識別。 我遵循了離線語音識別的基本教程，並在Swift中進行了移植。 這是設置步驟

self.openEarsEventsObserver = OEEventsObserver()
self.openEarsEventsObserver.delegate = self
let lmGenerator: OELanguageModelGenerator = OELanguageModelGenerator()
addWords()
let name = "LanguageModelFileStarSaver"
lmGenerator.generateLanguageModelFromArray(words, withFilesNamed: name, forAcousticModelAtPath: OEAcousticModel.pathToModel("AcousticModelEnglish"))
lmPath = lmGenerator.pathToSuccessfullyGeneratedLanguageModelWithRequestedName(name)
dicPath = lmGenerator.pathToSuccessfullyGeneratedDictionaryWithRequestedName(name)

在單個單詞和整個句子的安靜房間中，識別效果都很好（我想說它的命中率是90％）。 但是，當我在安靜的酒吧中嘗試使用淺背景噪音時，該應用甚至在識別單詞時都遇到了嚴重困難。 有背景噪音時，有什么方法可以改善語音識別能力？

Answer 1

如果背景噪聲或多或少是均勻的（即具有規則的模式），則可以嘗試修改聲學模型，否則這是一個開放性問題，有時稱為雞尾酒會效果 ，可以使用DNN 來部分解決。

Answer 2

嘗試此設置，對我來說效果很好。

try? OEPocketsphinxController.sharedInstance().setActive(true)
OEPocketsphinxController.sharedInstance().secondsOfSilenceToDetect = 2
OEPocketsphinxController.sharedInstance().setSecondsOfSilence()
OEPocketsphinxController.sharedInstance().vadThreshold = 3.5
OEPocketsphinxController.sharedInstance().removingNoise = true

或者，您可以嘗試使用iSphinx庫。

在iOS上使用OpenEars會由於背景噪音而導致識別不佳

問題描述

2 個解決方案

解決方案1
1 2016-02-22 19:46:45

解決方案2
0 2018-01-19 09:17:02

在iOS上使用OpenEars會由於背景噪音而導致識別不佳

問題描述

2 個解決方案

解決方案1 1 2016-02-22 19:46:45

解決方案2 0 2018-01-19 09:17:02

解決方案1
1 2016-02-22 19:46:45

解決方案2
0 2018-01-19 09:17:02