[英]How to implement speech recognition using Google Cloud Speech-to-Text API?
[英]Google Cloud Speech-to-Text API - Multi-speaker recognition?
新的Google Cloud Speech-to-Text API據說是市場上最好的。 它是否完全提供演講者注釋(或其他演講者信息)? 就像誰在什么時候說什么。 我似乎找不到它的文檔或提供提及它的示例的任何地方。
IBM和Amazon都這樣做。
如果有人可以讓我知道,我將不勝感激,謝謝!
API目前不提供個人說話者識別功能。 在問題跟蹤程序[1]中已將其作為功能請求記錄下來,但是目前尚無此功能的預計到達時間。 我建議給該問題加注星標,以接收有關此問題的未來評論和更新。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.