繁体   English   中英

pocketsphinx python gstreamer音频速率

[英]pocketsphinx python gstreamer audio rate

我在Linux上使用pocketsphinx,并且一直在使用CMU教程中的源代码。 我正在尝试上传HUB4词典,语言模型和声学模型。

我刚刚上载字典和语言模型之前就可以使用它,但是当我尝试使用声学模型时,出现此错误:

INFO:acmod.c(246):从/home/mintea/programs/hub4/hub4opensrc.cd_continuous_8gau/feat.params解析的特定于模型的特征参数FATAL_ERROR:“ fe_sigproc.c”,第405行:无法创建滤波器组,频率范围不匹配。 采样率8000.000000,FFT大小为512,下限5734.375000 <频率-15.625000>上限5078.125000。

这是我正在使用的代码的片段:

self.pipeline = gst.parse_launch('gconfaudiosrc ! audioconvert ! audioresample '
                                     + '! vader name=vad auto-threshold=true '
                                     + '! pocketsphinx name=asr ! fakesink')

asr = self.pipeline.get_by_name('asr')
asr.connect('partial_result', self.asr_partial_result)
asr.connect('result', self.asr_result)
asr.set_property('hmm', '/home/mintea/programs/hub4/hub4opensrc.cd_continuous_8gau')
asr.set_property('lm', '/home/mintea/programs/hub4/language_model.arpaformat.DMP')
asr.set_property('dict', '/home/mintea/programs/hub4/cmudict.hub4.06d.dic')        
asr.set_property('configured', True)

我想我在gst.parse_launch调用中配置了一个用于更改音频速率的标志,但是我不太确定该如何做。 有什么建议么? 谢谢!

您不能通过gstreamer插件使用hub4声学模型。 它要求采样率16000,而采样率8000在gstreamer插件源中进行硬编码。

您需要在gstreamer插件源中的多个位置将8000更改为16000,然后重新编译该插件,或者您需要使用8khz声学模型。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM