[英]Google Cloud Speech API real time recognition
我正在开发用于实时翻译的Python应用程序。 我需要实时识别语音:当用户说出某些内容时,它会自动将这段音频发送到Google Speech API并返回文本。 因此,我希望识别的文本在讲话时立即出现。
我已经找到了流语音识别,但似乎仍然需要先记录完整的语音,然后再将其发送到服务器。 此外,也没有在Python中使用它的示例
使用Google Speech API可以做到这一点吗?
您可以使用Google Speech API来实现。
但是,它有1分钟的内容限制。
请检查下面的链接。
https://cloud.google.com/speech/quotas
因此,您必须每1分钟重新启动一次。
下面的链接是python通过麦克风流式传输的示例代码。
https://cloud.google.com/speech/docs/streaming-recognize#speech-streaming-recognize-python
检查此链接:
https://github.com/Uberi/speech_recognition/blob/master/examples/microphone_recognition.py
这是从麦克风获取音频的示例。 识别过程有几个组成部分。 以我的经验,狮身人面像识别缺乏准确性。 Google语音识别效果很好。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.