簡體 English 中英

來自本地視頻的 SFSpeechRecognizer

[英]SFSpeechRecognizer from Local Video

原文 2022-05-10 12:29:44 4 1 ios/ swift/ audio/ avfoundation/ speech-recognition

我正在嘗試從視頻中實現語音轉錄（語音到文本）。 我的方法是將其分解為 3 個步驟：

將視頻轉換為音頻文件 (m4a/mp3)
使用音頻文件 url 將音頻傳遞給 SFSpeechRecognizer 請求
成績單

我的問題是我還沒有找到將源視頻文件（比如說 .mov）轉換為純音頻文件的方法。 視頻的 AVAsset 本身沒有任何音軌，但在播放文件時仍然有音頻（所以它確實存在）。

我想如果我能解決第 1 步，那么 2 + 3 是微不足道的，所以我的問題是 - 將視頻文件轉換為純音頻文件的最佳方法是什么，然后我可以將其用於轉錄。

1 個解決方案

您可以使用FFmpegKit庫來提取視頻的音頻部分。

庫示例： https ://github.com/tanersener/ffmpeg-kit/tree/main/apple#3-using

提取音頻的ffmpeg命令示例： https ://stackoverflow.com/a/27413824/5707560

從SFSpeechRecognizer獲取語音幅度

[英]Get voice amplitude from SFSpeechRecognizer

從本地路徑播放視頻

[英]Play a video from a local path

從 SFSpeechRecognizer 停止語音輸入后處理文本

[英]Process the text once voice input is stopped from SFSpeechRecognizer

如果從 Apple Music 播放音頻，SFSpeechRecognizer 無法在真實設備上運行

[英]SFSpeechRecognizer not working on real device if playing audio from Apple Music

無法播放iPhone的本地視頻

[英]Unable to play local video from iPhone

SCRecorder：如何從本地視頻創建SCRecordSession

[英]SCRecorder : How to create SCRecordSession from local video

Swift - 從本地視頻生成圖像縮略圖

[英]Swift - generating image thumbnail from a local video

從 swift 中的本地視頻創建縮略圖

[英]Creating thumbnail from local video in swift

Swift SFSpeechRecognizer 不能工作兩次

[英]Swift SFSpeechRecognizer not working twice

在按鈕單擊時暫停 SFSpeechRecognizer

[英]pause SFSpeechRecognizer on button click

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 從SFSpeechRecognizer獲取語音幅度從本地路徑播放視頻從 SFSpeechRecognizer 停止語音輸入后處理文本如果從 Apple Music 播放音頻，SFSpeechRecognizer 無法在真實設備上運行無法播放iPhone的本地視頻 SCRecorder：如何從本地視頻創建SCRecordSession Swift - 從本地視頻生成圖像縮略圖從 swift 中的本地視頻創建縮略圖 Swift SFSpeechRecognizer 不能工作兩次在按鈕單擊時暫停 SFSpeechRecognizer

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM