[英]Wit AI speech recognition
我正在嘗試向https://api.wit.ai/speech?v=20200513提交 ogg 格式的音頻。 我需要接收語音的文本表示。 當我通過 curl 請求提交代碼時,它返回空響應作為{"_text": "", "entities": ""}
。 我也嘗試用 pywit 執行它。 下面是代碼:
from wit import Wit
client = Wit('XXXXXXXXXXXXXXXXX')
with open('2.ogg', 'rb') as f:
print(f)
resp = client.post_speech(f, content_type='audio/ogg')
print('Yay, got Wit.ai response: ' + str(resp))
我的猜測是文件沒有被捕獲,但打印顯示_io.BufferedReader name='2.ogg'
,這意味着文件存儲在緩沖區中,但機智拒絕轉錄它。
為什么智慧以空_text
回應?
不知道為什么,但問題只發生在 OGG 文件中,即使文檔說明它確實適用於這個文件擴展名。 所以,我不得不將音頻轉換成 WAV,然后再試一次。 這一次它運行得非常好。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.