簡體   English   中英

用於 Pitch Class Profiling 的 Python 代碼

[英]Python Code for Pitch Class Profiling

我正在制定由 Takuy​​a Fujishima 提出的 Pitch Class Profile。 我已盡力實現這個等式(使用 scipy 和 numpy); 然而,我得到了一些相當奇怪的結果。 我曾就將其放在 DSP 上進行過辯論,但認為這更像是一個編碼問題,而不是方程理解問題。

無論如何,這是我的代碼。

import scipy.io.wavfile
import numpy as np
import math
import sys

class PCP:

    def __init__(self):
        self.note_references = [16.35, 17.32, 18.35, 19.45, 20.60, 21.83, 23.12, 24.50, 25.96, 27.50, 29.14, 30.87]
        self.results = {}


    def create_fft(self, filename):
        self.rate, self.data = scipy.io.wavfile.read('fmin.wav')
        print "Data from the File: \n", self.data

        self.frames = self.data.size
        print "Number of Frames: ", self.frames

        print "Rate: ", self.rate

        self.fft_results = np.fft.rfft(self.data) ##fft computing and normalization
        print "Results from the FFT: \n", self.fft_results


    # The work of the following classes was almost entirely based on a
    # thread in DSP.  Here is the link to the particular article
    # http://dsp.stackexchange.com/questions/13722/pitch-class-profiling
    # This function returns the values of the notes given the spectrograph
    def m_func(self, l, p):
        #M(l) = round(12 * log_2( (f_s*l)/(N*f_ref) ) ) % 12
        #print "L: ", l
        #print "Note: ", p
        a = self.rate * l
        b = self.frames * self.note_references[p]
        c = 12 * np.log2(a/b)
        d = np.round(c)
        e = np.mod(d.all(), 12)
        #print "Result: ", e
        #raw_input()
        return e


    def pcp(self, p):
        r = 0
        for l in self.fft_results:
            result = self.m_func(l[0], p)
            #print "actual returned result", result
            if result == p:
                r+=1
                #print "There was a match!  Add it!"
        return r


    def calculate_PCP(self):
        for p in range(0,11): #for all 12 notes
            self.results[p] = self.pcp(p)


    def print_results(self):
        for i in self.results.keys():
            print i , ":" , self.results[i]


def main():
    m = PCP()
    m.create_fft("fmin.wav")
    m.calculate_PCP()
    m.print_results()


if __name__ == '__main__':
    main()

以下是輸出:

Data from the File: 
[[16 15]
 [ 9  9]
 [15 15]
 ..., 
 [ 0  0]
 [ 0  0]
 [ 0  0]]
Number of Frames:  352800
Rate:  44100
Results from the FFT: 
[[ 31.+0.j   1.+0.j]
 [ 18.+0.j   0.+0.j]
 [ 30.+0.j   0.+0.j]
 ..., 
 [  0.+0.j   0.+0.j]
 [  0.+0.j   0.+0.j]
 [  0.+0.j   0.+0.j]]
PCP.py:36: RuntimeWarning: divide by zero encountered in log2
  c = 12 * np.log2(a/b)
PCP.py:36: RuntimeWarning: invalid value encountered in cdouble_scalars
  c = 12 * np.log2(a/b)
0 : 143
1 : 176263
2 : 0
3 : 0
4 : 0
5 : 0
6 : 0
7 : 0
8 : 0
9 : 0
10 : 0

該文件包含演奏 F 小調和弦的鋼琴(在結果字典中以 0、5 和 7 響應)。 然而,結果表明 C#/Db 的存在非常強烈,我當然可以驗證錄音中沒有 C#。 我將不勝感激任何幫助!

音高頻率不同於頻譜頻率,因此不等於每 12 個 fft 幅度結果箱的內容(特別是對於實際音樂聲音的錄音)。 如果不出意外,任何不是 2 次冪的強奇次諧波最終都會出現在錯誤的音級箱中。

所引用的算法僅適用於有限類別的波形,這些波形可能不代表現場音樂音頻。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM