繁体   English   中英

哪些库可用于分析音频文件中的语音关键词和/或语音转文本?

[英]What libraries are available for analyzing audio files for spoken keywords and/or speech to text?

我是业余时间的超级英雄,我正在尝试构建一个用于分析语音关键词的音频的应用程序。 (考虑紧急情况/ 911电话)如果关键字是“ robbery”,并且在音频中说出了这个词,则我想标记该文件并可能将其翻译为文本。

有哪些开发库或软件应用程序可以执行此类操作? 首选C ++或Java库,但不是必需的。

Wiki页面这里是一个很好的起点。 在这里提到的那些中,我认为CMU Sphinx是最活跃的。

您可以与Praat一起使用http://www.fon.hum.uva.nl/praat/ ,这是处理语音的出色程序,并且具有自己的脚本语言。 您还可以在Praat社区中找到很多脚本。 您还可以使用sendpraat http://www.fon.hum.uva.nl/praat/sendpraat.html将praat函数用作子例程。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM