立体声到 Mono wav in Python

Question

我正在使用 scipy 方法 wavefile.read() 加载一个 wav，它给我采样率和音频数据

我知道这个音频数据如果立体声存储为多维数组，例如

audiodata[[left right]
          [left right]
          ...
          [left right]]

然后我使用这种方法通过采用 (right+left)/2 创建一个新的 mono 音频数据数组

def stereoToMono(audiodata)
    newaudiodata = []

    for i in range(len(audiodata)):
        d = (audiodata[i][0] + audiodata[i][1])/2
        newaudiodata.append(d)

    return np.array(newaudiodata, dtype='int16')

然后我把它写到文件中

wavfile.write(newfilename, sr, newaudiodata)

这正在生成一个 Mono wav 文件，但是声音很脏并且一直在点击等

我究竟做错了什么？

Answer 1

首先， audiodata的数据类型是audiodata ？ 我假设它是某种固定宽度的整数格式，因此您会溢出。 如果在处理之前将其转换为浮点格式，它将正常工作：

audiodata = audiodata.astype(float)

其次，不要逐个元素编写 Python 代码； 矢量化它：

d = (audiodata[:,0] + audiodata[:,1]) / 2

甚至更好

d = audiodata.sum(axis=1) / 2

这将比您编写的逐个元素循环快得多。

Answer 2

事实证明，我必须改变的是

(右+左)/2

到

(右/2) + (左/2)

Answer 3

应用平均值后，您必须将数据保存为 int16

wavfile.write(newfilename, sr, np.int16(newaudiodata))

Answer 4

这应该有效。 您从立体声数据中获取第一个通道：

audiodata = [s[0] for s in audiodata]

立体声到 Mono wav in Python

问题描述

4 个解决方案

解决方案1
14 已采纳 2015-05-22 17:49:20

解决方案2
3 2015-05-22 17:02:51

解决方案3
0 2022-04-19 22:04:11

解决方案4
-1 2020-01-04 12:54:12

立体声到 Mono wav in Python

问题描述

4 个解决方案

解决方案1 14 已采纳 2015-05-22 17:49:20

解决方案2 3 2015-05-22 17:02:51

解决方案3 0 2022-04-19 22:04:11

解决方案4 -1 2020-01-04 12:54:12

解决方案1
14 已采纳 2015-05-22 17:49:20

解决方案2
3 2015-05-22 17:02:51

解决方案3
0 2022-04-19 22:04:11

解决方案4
-1 2020-01-04 12:54:12