簡體   English   中英

哪些庫可用於分析音頻文件中的語音關鍵詞和/或語音轉文本?

[英]What libraries are available for analyzing audio files for spoken keywords and/or speech to text?

我是業余時間的超級英雄,我正在嘗試構建一個用於分析語音關鍵詞的音頻的應用程序。 (考慮緊急情況/ 911電話)如果關鍵字是“ robbery”,並且在音頻中說出了這個詞,則我想標記該文件並可能將其翻譯為文本。

有哪些開發庫或軟件應用程序可以執行此類操作? 首選C ++或Java庫,但不是必需的。

Wiki頁面這里是一個很好的起點。 在這里提到的那些中,我認為CMU Sphinx是最活躍的。

您可以與Praat一起使用http://www.fon.hum.uva.nl/praat/ ,這是處理語音的出色程序,並且具有自己的腳本語言。 您還可以在Praat社區中找到很多腳本。 您還可以使用sendpraat http://www.fon.hum.uva.nl/praat/sendpraat.html將praat函數用作子例程。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM