簡體   English   中英

Wit AI語音識別

[英]Wit AI speech recognition

我正在嘗試向https://api.wit.ai/speech?v=20200513提交 ogg 格式的音頻。 我需要接收語音的文本表示。 當我通過 curl 請求提交代碼時,它返回空響應作為{"_text": "", "entities": ""} 我也嘗試用 pywit 執行它。 下面是代碼:

from wit import Wit

client = Wit('XXXXXXXXXXXXXXXXX')
with open('2.ogg', 'rb') as f:
    print(f)
    resp = client.post_speech(f, content_type='audio/ogg')

print('Yay, got Wit.ai response: ' + str(resp))

我的猜測是文件沒有被捕獲,但打印顯示_io.BufferedReader name='2.ogg' ,這意味着文件存儲在緩沖區中,但機智拒絕轉錄它。

為什么智慧以空_text回應?

不知道為什么,但問題只發生在 OGG 文件中,即使文檔說明它確實適用於這個文件擴展名。 所以,我不得不將音頻轉換成 WAV,然后再試一次。 這一次它運行得非常好。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM