pjsip/pjsua2 - 如何獲取音頻流以將其發送到 Speech-to-Text 引擎

Question

我正在嘗試從呼叫音頻媒體獲取音頻流，以便能夠將其發送到 Speech-to-Text 引擎（從流輸入轉錄音頻）。 關於如何實現這一目標的任何想法？

版本信息：用於 POSIX 的 pjlib 2.8-svn

先感謝您。

Answer 1

我從 pjsip 常見問題解答中找到了一個建議： https ://trac.pjsip.org/repos/wiki/FAQ#audio-man

您可以通過創建一個新的端口獲取實時音頻媒體，並找到有用的信息mem_capture.c和wav_writer.c ：

對於僅接收器的媒體端口，示例包括：

mem_capture.c從pjmedia（媒體端口保存音頻的緩沖液）。
wav_writer.c從pjmedia（媒體端口保存音頻波形文件）。

Answer 2

我也有這個問題。 你解決了嗎？

Answer 3

在Call類的onCallMediaState中使用getAudioMedia()，我們可以得到call的AudioMedia，類似這樣（C++中的簡單方法）：

void SipCall::onCallMediaState(OnCallMediaStateParam &prm) {
    this->callInfo = getInfo();
    unsigned media_size = this->callInfo.media.size();
    for (unsigned i = 0; i < media_size; i++) { // ci.media.size()
        AudioMedia audioMedia = getAudioMedia(i);
        // do somthing with audio Media
        // example send to audio device:
        // AudDevManager& manager = Endpoint::instance().audDevManager();
        // audioMedia.startTransmit(manager.getPlaybackDevMedia());
        // do something....
    } 
}

抱歉，但我希望它能有所幫助。

pjsip/pjsua2 - 如何獲取音頻流以將其發送到 Speech-to-Text 引擎

問題描述

2 個解決方案

解決方案1
0 2019-08-09 08:40:30

解決方案2
0 2019-10-27 14:19:29

解決方案3
-1 2019-08-01 04:32:37

pjsip/pjsua2 - 如何獲取音頻流以將其發送到 Speech-to-Text 引擎

問題描述

2 個解決方案

解決方案1 0 2019-08-09 08:40:30

解決方案2 0 2019-10-27 14:19:29

解決方案3 -1 2019-08-01 04:32:37

解決方案1
0 2019-08-09 08:40:30

解決方案2
0 2019-10-27 14:19:29

解決方案3
-1 2019-08-01 04:32:37