簡體   English   中英

Java語音識別

[英]Java voice recognition

有沒有人有任何開源或相對便宜的Java語音識別API的經驗? 我幾乎在尋找可以將口語變成文字的東西。

從sun上的java語音識別頁面來看,似乎是比較死的東西。 我的要求是至少在 linux 上運行的東西。

任何人都可以推薦一些東西嗎? 純 java 將是一個獎勵,否則可以考慮基於 linux 的解決方案。 而且由於這是一個家庭項目......越便宜越好。

  • 編輯

CMU Sphinx 正如 Amit 指出的那樣 CMU Sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php我的問題是大量的單詞錯誤率。 訓練本身就是一個項目,我希望這個周末能聚集一些力量去嘗試。

IBM ViaVoice
2004 年有關於Via Voice 開源的新聞公告。 新聞發布似乎為時過早,而且從未發生過。 VIA Voice 曾在某個時候針對 linux 發布過,但似乎已經停止了。 IBM 網站上似乎只剩下ViaVoice 嵌入式

IBM Websphere 語音
我想這就是 ViaVoice(桌面)似乎停產的原因。 IBM 創建了這個商業解決方案,其成本將超過一條胳膊和一條腿。 至少在我使用 websphere 和他們的 IDE 之后,僅僅使用它就會占用你剩下的那些。

細微差別
看來他們仍然可能為 linux 創建產品。 但我認為他們迷失了方向並跟隨 IBM 進入了服務器市場。 我對這個不太確定,他們的網站在查找有用信息方面不是那么友好。

開放思想/言論自由
這些家伙不斷改變他們的項目名稱。 可能是一些飢腸轆轆的公司不斷威脅他們,但我不知道。 該項目看起來有點死了。

我可能會在這個周末嘗試訓練 Sphinx,看看它是否願意成為朋友。 更糟糕的情況是,我將考慮使用 Microsoft 的語音解決方案。 過去它對我來說效果很好,但它不是一個很好的 linux 解決方案。 我可能可以通過 wine 使用它,但是我將有兩個單獨的服務器......凌亂凌亂。

哦,什么似乎是訪問語音/語音SpeechTechMag的好地方。 他們有一個“年度參考”,其中列出了以某種方式將自己與語音/語音相關聯的公司列表。

如果您的預算有限,sphinx 是迄今為止最好的選擇。 但是,它也會對您使用的模型、調整它們的方式以及調整音頻源的方式產生巨大影響 絕對一切都必須匹配,否則它就行不通了。 考慮到你描述的問題,我願意賭一大筆錢,因為你把你的模型搞混了,你的麥克風沒有正確校准。 此外,如果你有口音,它可能不會起作用——這不是解碼器的問題,而是聲學模型的問題——如果訓練數據中沒有包含與你相似的語音/口音的人,你會得到很差的結果.

也就是說,你看過他們的開源模型頁面嗎?

http://www.speech.cs.cmu.edu/sphinx/models/

根據您嘗試做的事情,您應該能夠使用 16kHz WSJ 模型和 gigaword LMs NVP 獲得大約 90% 的自由言論准確率。 但我提醒說,ASR 是一項艱巨的任務,尚未達到商品狀態。

您可以從http://www.basic-signalprocessing.com下載 vPass(語音密碼)。

這些組件是為 Java 和 .Net 語言設計的。 識別時間為 5 秒。 VPass 經過充分測試 vText 不是,仍然是新的,這就是為什么還沒有打包的原因。

我的小組用 Java 完成了一個使用Sphinx識別口語數字的小程序。

幾天來我一直在尋找同樣的東西。 到目前為止,我已經找到了 Sphinx4 和 FreeTTS。 兩者都是 java 實現,Sphinx 似乎與 FreeTTS 不同,它更新得相當頻繁。 我遇到的唯一問題是 Sphinx 在辦公環境中無法理解我,我需要一個倉庫環境的解決方案。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM