簡體   English   中英

向OpenEars添加新語言

[英]Add a new language to OpenEars

我最近開始學習OpenEars語音識別,這很棒! 但我還需要支持其他語言的語音識別和聽寫,如俄語,法語和德語。我發現這里有各種聲學和語言模型。

但我真的不明白 - 我需要在應用程序中集成額外的語言支持嗎?

問題是 - 我應該采取什么步驟才能在開放式耳機中成功整合,例如俄語?

據我所知 - Open Ears演示中所有英語語言和語言模型都位於文件夾hub4wsj_sc_8k中 voxforge語言檔案中可以找到相同的文件。 所以我只是在演示中替換它們。 有一點是不同的 - 在演示英語中,還有一個sendump 2MB大文件,它不在voxforge語言檔案中。在Open Ears演示中還有兩個其他文件:

  • OpenEars1.languagemodel
  • OpenEars1.dic

這些我替換為:

  • msu_ru_nsh.lm.dmp
  • msu_ru_nsh.dic

因為.dmp類似於.languagemodel。 但應用程序崩潰沒有任何錯誤。

我究竟做錯了什么? 謝謝。

根據我的評論,轉貼為答案:

[....]這樣的問題的第1步是打開OpenEarsLogging和verbosePocketsphinx,這將為您提供關於出錯的非常細粒度的信息(在控制台輸出中搜索單詞錯誤和警告以節省時間)。 有關這樣做的說明可以在文檔中找到。 隨意將問題提交給OpenEars論壇[....]: http ://politepix.com/forums/openears您可能還想查看此主題: http//politepix.com/forums/topic/other -languages

解決方案:

為了跟進后來的讀者,在打開日志記錄后,我們通過使用mixture_weights文件替代sendump並確保語音字典使用聲學模型中存在的音素而不是英語語音音素來實現此工作。 。

我們完成此故障排除的完整討論可在此處閱讀: http//www.politepix.com/forums/topic/using-russian-acoustic-model/


更新:由於本周發布了OpenEars 1.5,因此可以將路徑傳遞給任何聲學模型作為主要聆聽方法的參數,並且有一種更加標准化的方法用於打包和參考任何聲學模型,因此您可以擁有許多聲學模型聲學模型在同一個應用程序中。 這個論壇帖子中的信息取代了我在這個答案中鏈接的討論中的信息: http//www.politepix.com/forums/topic/creating-an-acoustic-model-bundle-for-openears-1-5 -and-up /我出於歷史原因留下了剩下的答案,因為在討論中可能還有一些有用的細節,但可以跳過它來支持新鏈接。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM