如何直接從麥克風播放輸入數據

Question

我想在不緩沖的情況下播放麥克風中的許多輸入數據。 我試過了，但是有緩沖。 這是我的代碼。

import pyaudio
import wave
import urllib.request
import struct
import numpy as np
import sounddevice as sd
import matplotlib.pyplot as plt

# Callback function---------------------------------
def callback(indata, outdata, frames, time, status):
#    if status:
#        print(status)
    outdata[:] = indata
#---------------------------------------------------

# Parameters ----------------------------------------------
Window_Size = 22050 # Point
FORMAT_D = pyaudio.paFloat32; FORMAT_W = pyaudio.paInt32
CHANNELS = 1 # Mono
Sample_Rate = 22050 # Hz
dT = 1/Sample_Rate
RECORD_SECONDS = 20 # s
NOFFRAMES = int(Sample_Rate/Window_Size * RECORD_SECONDS)
WAVE_OUTPUT_FILENAME = "output.wav"
#-----------------------------------------------------------

p = pyaudio.PyAudio()

stream_D = p.open(format=FORMAT_D,
                channels=CHANNELS,
                rate=Sample_Rate,
                input=True,
                frames_per_buffer=Window_Size)

stream_W = p.open(format=FORMAT_W,
            channels=CHANNELS,
            rate=Sample_Rate,
            input=True,
            frames_per_buffer=Window_Size)

print("* recording")

frames = []

# "I think the problem appears from here"------------------------------
for i in range(0, int(Sample_Rate/Window_Size * RECORD_SECONDS)):
    data_D = stream_D.read(Window_Size)
#    data_W = stream_W.read(Window_Size)
    decoded = np.fromstring(data_D, 'Float32')
#    np.savetxt(str(i)+'ttt.txt',transform)
    sd.play(decoded,22050)
#    frames.append(data_W)
#-------------------------------------------------------

print("* done recording")

stream_D.stop_stream()
stream_D.close()
p.terminate()

#plt.plot(transform)
#plt.show()

# Save as a wave file---------------------------
#wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
#wf.setnchannels(CHANNELS)
#wf.setsampwidth(p.get_sample_size(FORMAT_W))
#wf.setframerate(Sample_Rate)
#wf.writeframes(b''.join(frames))
#wf.close()
#-------------------------------------------

該代碼執行以下操作：以1s的間隔保存來自麥克風的輸入數據，將字節數據轉換為nparray數據（np.transform（）），並使用揚聲器播放數據（sd.play（））。 這段代碼有效，但是在for循環再次啟動時有緩沖。 我想平穩地播放麥克風的聲音。 當我首先詢問時，有人建議使用回調函數，所以我添加了它，但是，我不知道如何使用它。 如何擺脫緩沖？ 有一些例子嗎？ 我應該使用線程還是多處理？

Answer 1

延遲是由於緩沖區大小造成的...按照以下方式使用1k緩沖區將得到可忽略不計的延遲

# Window_Size = 22050 # Point
Window_Size = 1024 # Point

如何直接從麥克風播放輸入數據

問題描述

1 個解決方案

解決方案1
0 2017-11-23 16:49:51

如何直接從麥克風播放輸入數據

問題描述

1 個解決方案

解決方案1 0 2017-11-23 16:49:51

解決方案1
0 2017-11-23 16:49:51