簡體   English   中英

非常簡單的語音/語音識別算法

[英]Algorithm for very simple voice/speech recognition

我正在為Google Glass編寫游戲,但是很遺憾,SpeechRecognizer API在Google Glass GDK的當前版本中不可用。

因此,我一直在考慮實現一種非常簡單的語音識別算法。 假設我只想識別:“是”和“否”。
您是否知道任何示例代碼或任何有用的資源來幫助我實現這一目標?
我放棄這個想法並選擇像CMUSphinx這樣的大型框架難嗎?

如何識別:上,下,右,左或1到10之間的數字?

據我所知,通常通過快速傅立葉變換(FFT)進行分析並轉換到頻域。 還需要一些有聲單詞詞典來進行頻率相關。

請查看此鏈接:

CMU Sphinx有Java實現。

David Wagner有一篇不錯的文章和matlab實現。

PS哦,如果您用俄語講,為什么不讀這篇文章-非常簡單,帶有Java示例。

PPS老實說,我從不使用此框架,但是,如果您僅對語音識別有一個膚淺的了解,那么健壯和最簡單的方法就是使用現有的完整解決方案,例如框架或庫,否則,您需要花費時間來擁有必要的知識門檻。 在這種情況下,你可以閱讀文章。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM