.wav文件处理期间的输出失真

Question

我想处理一个.wav文件，例如降低幅度； 当我使用以下代码时，输出会失真，这并不令人满意。

#include <iostream>
#include <fstream>
#include <string>
using namespace std;
int main()
{
    char* wav_mem;
    ifstream wav_file;
    wav_file.open("1.wav", ios::binary | ios::ate);
    int file_size = wav_file.tellg();
    wav_mem = new char[file_size];
    wav_file.seekg(0, ios::beg);
    wav_file.read(wav_mem, file_size);
    int16_t sample = 0;
    wav_file.close();
    for(int i = 44; i <= file_size; i += 2)
    {   
        sample = ((wav_mem[i + 1] << 8) | (wav_mem[i]));
        sample = (int16_t)(sample * 0.5);
        wav_mem[i] = sample;
        wav_mem[i+1] = (sample >> 8);
    }
    ofstream out_file;
    out_file.open("out.wav", ios::binary);
    out_file.write(wav_mem, file_size);
}

如何解决变形？

Answer 1

假设您对.wav文件本身采取的措施是合理的（否则，我对它的了解并不多，是否知道这是问题所在），则可能存在一些潜在的缺陷：

在int收集tellg的输出可能会导致溢出。 也许使用auto获取正确的类型？
wav_mem[i+1] = (sample >> 8); 当i == file_size在循环中可能导致溢出访问（超出wav_mem的长度）时？

编辑：实际上[0, file_size)由于您的wav_mem = new char[file_size];实际上只能以定义的方式访问[0, file_size)索引wav_mem = new char[file_size]; 线。 因此，当i = file_size ， wav_mem[i]和wav_mem[i+1] UB。

Answer 2

我认为问题可能出在对有符号整数使用bitshift运算符>>上。 根据标准， <<的实际行为在C ++ 14中已更改，并且在C ++ 20中将再次更改（请参阅 “按位移位运算符”）。 无论哪种方式，它都不是逻辑位移，而是算术位移。

相反，我将使用reinterpret_cast将两个字节都转换为一个16位整数。 我过去使用过这样的东西：

int16_t num;
for (size_t i = 0; i < N && wav_file.read(reinterpret_cast<char*>(&num), 2); ++i) {
    audio[i] = double(num);
}

/* do stuff */

for (double x : audio) {
    num = static_cast<int16_t>(x);
    out_file.write(reinterpret_cast<char*>(&num), 2);
}

请注意，由于RIFF使用LittleEndian，因此这里假设使用LittleEndian体系结构。

Answer 3

我解决了这个问题，当我尝试将两个字节转换为16位时，我弄乱了示例，这是最终代码：

#include <iostream>
#include <fstream>
#include <string>
#include <string.h>
using namespace std;

int main()
{
    ifstream wav_file;
    ofstream out_file;
    wav_file.open("input.wav",ios::binary|ios::ate);
    size_t file_size = wav_file.tellg();
    char * wav_buf = new char[file_size];
    wav_file.seekg (0,ios::beg);
    wav_file.read (wav_buf, file_size);
    wav_file.close();
    int16_t wav_smpl(0);
    char * wav_out = new char[file_size];
    memcpy(wav_out, wav_buf, 44);
    for (size_t i = 0 ; i < file_size ; i += 2) 
    {
        memcpy(&wav_smpl , wav_buf + (i + 44) , 2);
        wav_smpl *= 3;
        memcpy(wav_out + (i + 44) , &wav_smpl , 2);
    }
    out_file.open("output.wav",ios::binary);
    out_file.write(wav_out, file_size);
    out_file.close();
    return 0;
}

Answer 4

撇开前面提到的wav_mem[i + 1]中的tellg和未定义行为中的溢出，我认为这是主要问题：

sample = (int16_t)(sample * 0.5);

在后台将sample转换为两倍。 来回转换为double或从double转换可能会导致较小的（但我想是可以听到的）舍入错误，我认为这可能是失真的来源。 代替这种用法：

sample /= 2;

.wav文件处理期间的输出失真

问题描述

4 个解决方案

解决方案1
4 2019-08-29 12:29:08

解决方案2
1 2019-08-29 12:55:46

解决方案3
1 已采纳 2019-09-02 22:30:04

解决方案4
0 2019-08-29 12:56:28

.wav文件处理期间的输出失真

问题描述

4 个解决方案

解决方案1 4 2019-08-29 12:29:08

解决方案2 1 2019-08-29 12:55:46

解决方案3 1 已采纳 2019-09-02 22:30:04

解决方案4 0 2019-08-29 12:56:28

解决方案1
4 2019-08-29 12:29:08

解决方案2
1 2019-08-29 12:55:46

解决方案3
1 已采纳 2019-09-02 22:30:04

解决方案4
0 2019-08-29 12:56:28