簡體   English   中英

使用FFT比較兩個音頻文件然后實時比較

[英]Using FFT to compare two audio files and then realtime comparison

我正在為 Android 制作一個應用程序,它將保存用戶語音命令,然后在應用程序運行時; 將來自麥克風輸入的實時數據與保存的數據進行比較。 到目前為止,我已經將語音保存在 wav 文件中,現在我想將它與輸入 stream 進行比較。我使用這個 API 應用了 FFT,因為它與 Android 兼容:

http://code.google.com/p/musicg/

我也不太了解這個 api 但是,我認為 FFT 數據存儲在 FrequencyTimeDomainRepresentation object 中。我在 inte.net 上搜索並發現我必須使用 window 來比較數據但是,我不知道該怎么做所以。 我不知道如何比較數據。

請告訴我如何比較 FFT 數據以及如何將保存的文件數據與輸入的 stream 數據進行匹配,我的意思是代碼。 同時,我正在嘗試使用 java 比較兩個音頻文件,暫時不使用 android。

任何幫助將不勝感激,謝謝。

正如評論中提到的,這是一個與 dsp 相關的問題。 您應該在 dspexchange 上詢問詳細信息。

但是給你一個快速的'n'dirty答案。 准確定義你的算法應該做什么。 它應該做語音識別嗎? 如果您只想簡單地衡量相似性,請使用互相關(詢問谷歌)。 您也不需要為此進行 FFT(最近 FFT 似乎被過度使用了很多。每個人都不知道他在做什么,卻想出了 FFT 的東西)。 一旦你知道你想做什么並且你知道你真的需要它,FFT 可能會發揮作用; 也許是為了應用一些心理聲學 model。但即便如此,一個簡單的 haar 變換可能更足夠、更簡單和更快,尤其是在移動設備上。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM