iOS上的語音識別-將OOV單詞轉換為iOS上的音素？

Question

我已經嘗試過，如StackOverflow上所建議的那樣，成功完成了Openears，並從NSSTRINGS數組生成了自定義詞匯表。 但是，我們還需要從通訊簿中識別名稱，並且在這種情況下，后備方法不可避免地會經常失敗，並且會失敗……

我可以編寫一個解析器，然后動態地將文本（主要是法語和荷蘭語的發音名稱）轉錄成音素，但這將是很多（猜測）的工作……。 我很確定我需要的數據是在識別過程中的某個位置生成的，所以也許有人可以用我可以在iOS上利用的方式將我指向OpenEars或Flite代碼中的一個鈎子？

還是其他一些可以將用戶語音轉換為我可以輸入Openears的音素字符串的庫？

Answer 1

識別openears中名稱的正確方法是將特定的發音放入語音詞典中。 您不需要自己分析語音字符串，而且實際上識別器完全沒有有關語音字符串的信息，因此您甚至無法檢索它。 另外，音頻和音素序列之間也沒有明確的對應關系。

例如，音素到音素代碼可以推遲以下發音：

tena    T IH N

雖然正確的發音是

tena    T EH N AH

如果預測的發音不正確，識別器將無法識別名稱。 經過更正，它將可以准確識別名稱

問題在於，openears中的自動單詞到音素轉換可能會失敗。 對於外來詞，它可能會更頻繁地失敗。 您需要做的是將名稱添加到字典中，以便識別器知道其正確的語音序列。 如果知道正確的順序，識別器將能夠自己檢測單詞。 您還可以改善筆形符號到openears中的音素代碼，使其更准確。 現代的掌上獅身人面像使用phonetisaurus API，它不僅比flite更為准確，而且可以在特殊情況下（例如外來名稱）進行訓練。

對於准確性方面存在的所有問題，首先建議收集測試樣本數據庫以啟用字符串精度分析。 一旦有了這樣的數據庫，就可以大大提高准確性。 查看詳情

http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

iOS上的語音識別-將OOV單詞轉換為iOS上的音素？

問題描述

1 個解決方案

解決方案1
0 2014-03-01 23:01:29

iOS上的語音識別-將OOV單詞轉換為iOS上的音素？

問題描述

1 個解決方案

解決方案1 0 2014-03-01 23:01:29

解決方案1
0 2014-03-01 23:01:29