繁体   English   中英

Google Cloud Speech API实时识别

[英]Google Cloud Speech API real time recognition

我正在开发用于实时翻译的Python应用程序。 我需要实时识别语音:当用户说出某些内容时,它会自动将这段音频发送到Google Speech API并返回文本。 因此,我希望识别的文本在讲话时立即出现。

我已经找到了流语音识别,但似乎仍然需要先记录完整的语音,然后再将其发送到服务器。 此外,也没有在Python中使用它的示例

使用Google Speech API可以做到这一点吗?

您可以使用Google Speech API来实现。

但是,它有1分钟的内容限制。

请检查下面的链接。

https://cloud.google.com/speech/quotas

因此,您必须每1分钟重新启动一次。

下面的链接是python通过麦克风流式传输的示例代码。

https://cloud.google.com/speech/docs/streaming-recognize#speech-streaming-recognize-python

检查此链接:

https://github.com/Uberi/speech_recognition/blob/master/examples/microphone_recognition.py

这是从麦克风获取音频的示例。 识别过程有几个组成部分。 以我的经验,狮身人面像识别缺乏准确性。 Google语音识别效果很好。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM