繁体   English   中英

Microsoft Azure 认知服务 - 说话人识别 - 速率限制

[英]Microsoft Azure cognition services - Speaker Recognition - Rate Limit

我使用 Microsoft Azure 和认知服务来使用说话人识别 API。 我订阅了“随用随付”的标准定价层(每秒 5 次通话)。 我使用 Unity 进行录音并将音频发送到服务器。

每 5 秒,我在 C# 脚本的更新函数中将音频发送到服务器。 但是大约 30 秒的语音,我收到了错误 429:代码:RateLimitExceeded,消息:超出了速率限制。 稍后再试。

如果有人使用它,您知道为什么我从服务器收到此响应,而我有订阅以避免此限制。

我加入了微软助手,他们告诉我订阅是有效的,但我没有看到任何直接借记。

如果您在此处https://github.com/Microsoft/Cognitive-SpeakerRecognition-Windows查看自述文件部分中的注释,

注意:确保每分钟因调整步长而产生的请求数不会超过订阅的速率限制。

例如,对大小为 1 分钟的音频文件应用步长 1 将导致 60 个请求。 对同一个音频文件应用 2 的步长将产生 30 个请求。 为方便起见,我们提供了用于注册 2 个扬声器的示例音频和用于流式传输的示例音频。 这些音频位于 SpeakerRecognition\Windows\Streaming\SPIDStreamingAPI-WPF-Samples\SampleAudios 下。

另外,根据https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/上的 API 链接,音频文件格式必须满足以下要求:

  1. 容器 - WAV
  2. 编码 - PCM
  3. 速率 - 16K
  4. 样本格式 - 16 位
  5. 频道 - 单声道

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM