簡體   English   中英

iOS上的語音識別-將OOV單詞轉換為iOS上的音素?

[英]voice recognition on iOS - convert OOV words to phonemes on iOS?

我已經嘗試過,如StackOverflow上所建議的那樣,成功完成了Openears,並從NSSTRINGS數組生成了自定義詞匯表。 但是,我們還需要從通訊簿中識別名稱,並且在這種情況下,后備方法不可避免地會經常失敗,並且會失敗……

我可以編寫一個解析器,然后動態地將文本(主要是法語和荷蘭語的發音名稱)轉錄成音素,但這將是很多(猜測)的工作……。 我很確定我需要的數據是在識別過程中的某個位置生成的,所以也許有人可以用我可以在iOS上利用的方式將我指向OpenEars或Flite代碼中的一個鈎子?

還是其他一些可以將用戶語音轉換為我可以輸入Openears的音素字符串的庫?

識別openears中名稱的正確方法是將特定的發音放入語音詞典中。 您不需要自己分析語音字符串,而且實際上識別器完全沒有有關語音字符串的信息,因此您甚至無法檢索它。 另外,音頻和音素序列之間也沒有明確的對應關系。

例如,音素到音素代碼可以推遲以下發音:

tena    T IH N

雖然正確的發音是

tena    T EH N AH

如果預測的發音不正確,識別器將無法識別名稱。 經過更正,它將可以准確識別名稱

問題在於,openears中的自動單詞到音素轉換可能會失敗。 對於外來詞,它可能會更頻繁地失敗。 您需要做的是將名稱添加到字典中,以便識別器知道其正確的語音序列。 如果知道正確的順序,識別器將能夠自己檢測單詞。 您還可以改善筆形符號到openears中的音素代碼,使其更准確。 現代的掌上獅身人面像使用phonetisaurus API,它不僅比flite更為准確,而且可以在特殊情況下(例如外來名稱)進行訓練。

對於准確性方面存在的所有問題,首先建議收集測試樣本數據庫以啟用字符串精度分析。 一旦有了這樣的數據庫,就可以大大提高准確性。 查看詳情

http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM