Wit AI語音識別

Question

我正在嘗試向https://api.wit.ai/speech?v=20200513提交 ogg 格式的音頻。 我需要接收語音的文本表示。 當我通過 curl 請求提交代碼時，它返回空響應作為{"_text": "", "entities": ""} 。 我也嘗試用 pywit 執行它。 下面是代碼：

from wit import Wit

client = Wit('XXXXXXXXXXXXXXXXX')
with open('2.ogg', 'rb') as f:
    print(f)
    resp = client.post_speech(f, content_type='audio/ogg')

print('Yay, got Wit.ai response: ' + str(resp))

我的猜測是文件沒有被捕獲，但打印顯示_io.BufferedReader name='2.ogg' ，這意味着文件存儲在緩沖區中，但機智拒絕轉錄它。

為什么智慧以空_text回應？

Answer 1

不知道為什么，但問題只發生在 OGG 文件中，即使文檔說明它確實適用於這個文件擴展名。 所以，我不得不將音頻轉換成 WAV，然后再試一次。 這一次它運行得非常好。

Wit AI語音識別

問題描述

1 個解決方案

解決方案1
0 2020-09-01 08:59:30

Wit AI語音識別

問題描述

1 個解決方案

解決方案1 0 2020-09-01 08:59:30

解決方案1
0 2020-09-01 08:59:30