[英]Algorithm for very simple voice/speech recognition
我正在為Google Glass編寫游戲,但是很遺憾,SpeechRecognizer API在Google Glass GDK的當前版本中不可用。
因此,我一直在考慮實現一種非常簡單的語音識別算法。 假設我只想識別:“是”和“否”。
您是否知道任何示例代碼或任何有用的資源來幫助我實現這一目標?
我放棄這個想法並選擇像CMUSphinx這樣的大型框架難嗎?
如何識別:上,下,右,左或1到10之間的數字?
據我所知,通常通過快速傅立葉變換(FFT)進行分析並轉換到頻域。 還需要一些有聲單詞詞典來進行頻率相關。
請查看此鏈接:
CMU Sphinx有Java實現。
David Wagner有一篇不錯的文章和matlab實現。
PS哦,如果您用俄語講,為什么不讀這篇文章-非常簡單,帶有Java示例。
PPS老實說,我從不使用此框架,但是,如果您僅對語音識別有一個膚淺的了解,那么健壯和最簡單的方法就是使用現有的完整解決方案,例如框架或庫,否則,您需要花費時間來擁有必要的知識門檻。 在這種情況下,你可以閱讀該文章。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.