繁体   English   中英

iOS上的语音识别-将OOV单词转换为iOS上的音素?

[英]voice recognition on iOS - convert OOV words to phonemes on iOS?

我已经尝试过,如StackOverflow上所建议的那样,成功完成了Openears,并从NSSTRINGS数组生成了自定义词汇表。 但是,我们还需要从通讯簿中识别名称,并且在这种情况下,后备方法不可避免地会经常失败,并且会失败……

我可以编写一个解析器,然后动态地将文本(主要是法语和荷兰语的发音名称)转录成音素,但这将是很多(猜测)的工作……。 我很确定我需要的数据是在识别过程中的某个位置生成的,所以也许有人可以用我可以在iOS上利用的方式将我指向OpenEars或Flite代码中的一个钩子?

还是其他一些可以将用户语音转换为我可以输入Openears的音素字符串的库?

识别openears中名称的正确方法是将特定的发音放入语音词典中。 您不需要自己分析语音字符串,而且实际上识别器完全没有有关语音字符串的信息,因此您甚至无法检索它。 另外,音频和音素序列之间也没有明确的对应关系。

例如,音素到音素代码可以推迟以下发音:

tena    T IH N

虽然正确的发音是

tena    T EH N AH

如果预测的发音不正确,识别器将无法识别名称。 经过更正,它将可以准确识别名称

问题在于,openears中的自动单词到音素转换可能会失败。 对于外来词,它可能会更频繁地失败。 您需要做的是将名称添加到字典中,以便识别器知道其正确的语音序列。 如果知道正确的顺序,识别器将能够自己检测单词。 您还可以改善笔形符号到openears中的音素代码,使其更准确。 现代的掌上狮身人面像使用phonetisaurus API,它不仅比flite更为准确,而且可以在特殊情况下(例如外来名称)进行训练。

对于准确性方面存在的所有问题,首先建议收集测试样本数据库以启用字符串精度分析。 一旦有了这样的数据库,就可以大大提高准确性。 查看详情

http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM