簡體   English   中英

聲學指紋背后的原理是什么?

[英]What are the principles behind acoustic fingerprinting?

哪種API或框架用於為音樂音符分配值? 像Shazzam這樣的應用程序如何從麥克風中獲取音符並知道如何處理呢? 對我來說,手機麥克風和某些巧妙的邏輯可以與音樂商店的調諧器競爭,真是太神奇了!

編輯1。

有趣的論文。 Shazzam音樂識別應用程序的軟件基於聲學指紋識別快速傅立葉變換的原理

這是實際中一些類似代碼的示例

聲學指紋算法不會嘗試分析音樂。 也就是說,它們不會將音頻從麥克風轉換為音符。 他們正在從音頻中提取一些任意特征,這些特征從音樂理論的角度來看並沒有多大意義,但對於識別音樂仍然很有用。

通常,您從頻譜圖開始。 頻譜圖是對頻率隨時間變化的分析。 這對於幾乎所有聲學指紋識別算法都是常見的。 他們對頻譜圖的處理方式以及從中提取的特征有何不同。 有些算法正在尋找頻譜圖中的峰值,有些則將其分成規則的間隔。 最終目標通常是生成一堆可以索引並快速搜索的哈希。

Avery Li-Chun Wang最初的Shazam算法是公開可用的。 您可以在此處找到詳細信息。

簡短的說明。

步驟1.使用FFT分析所有歌曲文件的原始頻率

步驟2,根據先前的FFT分析結果,建立適當的樹數據結構,以便我們按頻率搜索歌曲。

步驟3.使用麥克風錄制來自外部環境的歌曲。 並使用FFT進行分析。 從先前的頻率樹中搜索匹配的頻率。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM