
[英]Extracting a particular sound from an audio clip
假设在 python 中有一个 wav 文件,其中包含鸟噪声、拖拉机噪声、脚步噪声等声音,如何单独提取脚步噪声。我想为我的音频处理项目这样做,以单独检测脚步噪声应用降噪技术可将脚步声音频视为噪音。 我也不知道在信号处理方面要使用哪种滤波器(低通/高通滤波器) ...
[英]Extracting a particular sound from an audio clip
假设在 python 中有一个 wav 文件,其中包含鸟噪声、拖拉机噪声、脚步噪声等声音,如何单独提取脚步噪声。我想为我的音频处理项目这样做,以单独检测脚步噪声应用降噪技术可将脚步声音频视为噪音。 我也不知道在信号处理方面要使用哪种滤波器(低通/高通滤波器) ...
[英]How to get complete fundamental (f0) frequency extraction with python lib librosa.pyin?
赏金将在 15 小时后到期。 此问题的答案有资格获得+50声望赏金。 jmhead正在寻找这个问题的更详细的答案: 现在有一个指向音频样本的链接,最好了解为什么前半部分没有提取音调,以及哪些方法/设置可能对提取更多细节有用。 我在语音音频剪辑上运行 librosa.pyin,它似乎并没有从录音的 ...
[英]How to turn a numpy array (mic/loopback input) into a torchaudio waveform for a PyTorch classifier
我目前正在使用 PyTorch 和 torchaudio 训练分类器。 为此,我遵循了以下教程: https://towardsdatascience.com/audio-deep-learning-made-simple-sound-classification-step-by-step-cebc ...
[英]Python Librosa efficient way to get a part from audio that matches condition
我使用 librosa 模块来获取这个音频文件信号,我使用了这个代码: 我明白了: 我知道 python,但我对音频处理和这些东西一无所知。 现在,有没有办法让长文件音频中的所有部分,比如 1 小时,有所有这些激烈的部分(音乐)。 ...
[英]Flutter: How do I create an echo effect with the just_audio plugin?
我正在使用just_audio flutter 插件将录音修改为高音或低音播放。 我现在想添加回声效果。 作为参考,您可以在Audacity中执行此操作(见下图) - 这是我想使用just_audio插件复制的效果。 作为一个更普遍的问题 - just_audio插件可以在多大程度上用于向声音剪辑 ...
[英]How to write an audio file that is inside a for loop in python
我必须写一个回显代码。 所以我写了这段代码。 我想知道如何将这些中的每一个添加到单独的 wav 文件中。 有人可以给我一个答案。 提前致谢。 ...
[英]How to emulate telephone channel 8k speech given 16k microphone speech recording
我的任务是模拟 8k 固定电话/蜂窝/VoIP 语音音频,给定 16k 麦克风录音。 模仿它的主要阶段是什么? 我找到了关于这种增强的这个torchaudio 教程,它是关于如何做的最详细的说明。 最后,我看到以下 16k mic -> 8k tel 转换管道: 16k -> ...
[英]Is there anyway to recognize just one word without using speech to text api in python
当用户说出给定的词时我需要打开一些东西,假设这个词是“你好”,所以每当用户说“你好”我需要打开一些东西,我只需要识别这个词,而我不需要不想用整个语音发送短信 API 来识别一个词。 我已经尝试了一些使用频率的东西但没有用。 任何帮助将不胜感激。 谢谢你。 ...
[英]How make audio to start from the specified point in the video and last specified amount of time
假设我有名为“samplevideo”的示例视频和名为"sampleaudio" "samplevideo"的示例音频。 我想用从 5 秒到 12 秒的 sampleaudio 替换 samplevideo 的音频。 直到 5 秒标记视频音频不会改变,然后 sampleaudio 开始并持续 7 秒 ...
[英]Audio signal Filtering
我正在尝试使用巴特沃斯带通滤波器(来自 NWaves Nuget 的 C#)过滤音频信号,然后使用 audacity 对过滤后的信号进行频率分析以检查和验证结果。 原始信号 无滤波器我使用 NWaves nuget 通过这些参数获得以下结果我的音频信号采样率: 88200赫兹我的截止频率: 低切频 ...
[英]Remove noise from vocals of a song python
我正在尝试使用深度学习 model 将人声与歌曲分开。output 没有错,但一些额外的噪音导致信号听起来很糟糕。 以下是存在噪音的output文件的3秒(长方形区域为噪音): 链接到音频文件如何从我的 output 文件中删除这些噪音? 我可以看到这些部分的振幅与我想要的歌曲的其他部分不同。 ...
[英]Split mid-side channels in stereo audio file
我想在 python 中创建一个中侧 EQ(允许您分别编辑中侧通道)。 知道如何从音频文件中提取中声道和侧声道吗? ...
[英]Extracting Instrument Qualities From Audio Signal
我正在寻找编写一个 function 接收音频信号(假设它包含单个乐器演奏),我想从中提取类似乐器的特征从音频中提取到向量空间中。 所以理论上,如果我有两个具有相似声音的乐器(例如两架钢琴)的信号,它们各自的向量应该非常相似(通过欧几里得距离/余弦相似度等)。 一个 go 会怎么做呢? 我已经尝试过 ...
[英]What can I use to take frequencies from a song?
我编写了一个 VB.NET WinForms 应用程序,它允许我执行傅立叶变换以找到离散频率的幅度,以将“强度”表示为条形图。 这方面的代码已经准备好并经过测试。 由于没有人可以帮助我的最后一个问题如何获得声卡的波形(波段)? ,我现在有了分析一段音乐的频率的想法。 我必须查看 .mp3 文件的 ...
[英]Find the best decibel threshold to split an audio into segments with and without human voice in Python
我正在尝试将音频分成有和没有人声的片段。 我已经开始使用从librosa中分离出来的方法,它做得非常好。 我遇到的唯一问题是定义静音的最佳阈值。 此方法有一个参数top_db (以分贝为单位),它将其下方的所有内容视为静音。 目前,我使用的是 40 dB 的硬编码值。 对于某些音频,它可以正常工作, ...
[英]Ogg opus granule position to timestamp
With an ultimate aim to crop/cut/trim the Ogg file containing a single opus stream, I'm trying to retrieve and filter ogg pages form the file and tho ...
[英]Different formats (bit rate) of audio data for entering Automatic speech recognition models
我想知道在对不同格式的音频数据进行任何预处理之前我应该做什么 例如,假设您有 8kbit/s 的电话数据和 250kbit/s 的 mp3 数据,集成这两种格式的最佳方法是什么? ...
[英]Getting different background colour of spectrograph from audio reading
我正在尝试读取音频并将其转换为 mel 频谱图以用于机器学习模型的训练,但是我从相同大小的音频中获得了不同的频谱图,并且每个音频的采样频率都相同,我想获得相同背景的频谱图,以便我的机器学习模型可以获得更好的准确性。 https://i.stack.imgur.com/beDR8.png ...
[英]Heart rate(BPM) calculation from .wav file
我有一个数字听诊器,我可以用 Android 手机轻松录制人的心音,而且很清晰,我可以从录制的文件中清楚地听到 lub-dub(s1-S2)。 我想计算录制音频的心率,有没有办法从音频文件中计算 BPM? 我已经用 Kotlin 编写了 Android 应用程序,并用 Java 编写了一些部分。 ...
[英]How do I split Mel Spectrogram into sub-bands of different frequency ranges
我对音频信号处理很陌生,但是我遇到了这个任务,但遇到了困难。 我想要实现的是,假设我已经使用 Mel Spectrogram 对语音音频进行了特征提取,频率范围为 Mel 标度(300Hz,3400Hz)。 例如,我怎样才能进一步将其分成 5 个不重叠的子带频段 1:[300Hz、627Hz] 频段 ...