[英]FFT and inverse of FFT
我是一名從事電信項目的計算機程序員。
在我們的項目中,我必須將一系列復數轉換為傅里葉變換。因此我需要一個有效的C89
標准FFT
代碼。
我使用以下代碼,它運作良好:
short FFT(short int dir,long m,double *x,double *y)
{
long n,i,i1,j,k,i2,l,l1,l2;
double c1,c2,tx,ty,t1,t2,u1,u2,z;
/* Calculate the number of points */
n = 1;
for (i=0;i<m;i++)
n *= 2;
/* Do the bit reversal */
i2 = n >> 1;
j = 0;
for (i=0;i<n-1;i++) {
if (i < j) {
tx = x[i];
ty = y[i];
x[i] = x[j];
y[i] = y[j];
x[j] = tx;
y[j] = ty;
}
k = i2;
while (k <= j) {
j -= k;
k >>= 1;
}
j += k;
}
/* Compute the FFT */
c1 = -1.0;
c2 = 0.0;
l2 = 1;
for (l=0;l<m;l++) {
l1 = l2;
l2 <<= 1;
u1 = 1.0;
u2 = 0.0;
for (j=0;j<l1;j++) {
for (i=j;i<n;i+=l2) {
i1 = i + l1;
t1 = u1 * x[i1] - u2 * y[i1];
t2 = u1 * y[i1] + u2 * x[i1];
x[i1] = x[i] - t1;
y[i1] = y[i] - t2;
x[i] += t1;
y[i] += t2;
}
z = u1 * c1 - u2 * c2;
u2 = u1 * c2 + u2 * c1;
u1 = z;
}
c2 = sqrt((1.0 - c1) / 2.0);
if (dir == 1)
c2 = -c2;
c1 = sqrt((1.0 + c1) / 2.0);
}
/* Scaling for forward transform */
if (dir == 1) {
for (i=0;i<n;i++) {
x[i] /= n;
y[i] /= n;
}
}
return(true);
}
但是這段代碼只支持大小為2^m
數組。就像CLRS
書籍代碼一樣。
我們應該轉換的數組不在這個范圍內,加零將是昂貴的,所以我正在尋找另一種解決方案,幫助我輸入任何大小。
像IT++
和matlab
那樣的東西。 但是正如我們希望它在純C中使用它們是不可能的。而且, IT++
代碼在我檢查時被阻止了
如果您正在開發任何大眾市場計算平台(帶有Windows或OS X,iOS等的英特爾),那么供應商或制造商就會提供高性能的FFT實現。
否則,您應該評估FFTW 。
為2的冪以外的大小編寫高性能FFT是一項復雜的任務。
如果您打算使用自己的實現,那么,僅關於兩種功能:
您顯示的實現在FFT期間計算sqrt
。 大多數高性能FFT實現會提前計算常量並將它們存儲在表中。
縮放包含除法運算,在x[i] /= n
和y[i] /= n
。 編譯器可能將這些實現為除法指令。 分區通常是對通用處理器的慢速指令。 計算scale = 1. / n
一次並乘以scale
而不是除以n
會更好。
更好的是完全省略比例。 變換通常在沒有比例的情況下有用,或者可以從單個變換中省略比例,並且僅作為聚合比例應用一次。 (例如,不是進行兩次縮放操作,一次在正向FFT中,一次在逆FFT中,而是將縮放操作保留在FFT例程之外,並且在正向FFT和反向FFT之后只執行一次。)
如果可以接受以頻率反轉順序排列頻域數據,則可以省略位反轉置換。
如果保持位反轉置換,則可以對其進行優化。 執行此操作的技術取決於平台。 一些平台具有反轉整數位的指令(例如,ARM具有rbit
)。 如果您的平台沒有,您可能希望將位反轉索引保留在表中,或者比當前代碼更快地研究計算它們的方法。
如果同時保持位反轉置換和縮放,則應考慮同時執行它們。 置換使用大量內存運動,縮放使用處理器的算術單元。 大多數現代處理器可以同時執行這兩種處理,因此您可以從重疊操作中獲得一些好處。
您當前的代碼使用基數為2的蝴蝶。 Radix-4通常更好,因為它可以通過改變i來實現,只需改變使用哪個數據並將一些加法改為減法,反之亦然。
如果您的陣列長度接近處理器上的第一級內存緩存的大小,則部分FFT實現將破壞緩存並顯着減慢速度,除非您設計適當的代碼來處理此問題(通常通過將數組的部分臨時復制到緩沖區中) )。
如果您的目標處理器具有SIMD功能,您絕對應該使用FFT中的功能; 它們極大地加速了FFT性能。
以上內容應該告訴您,編寫高效的FFT是一項復雜的任務。 除非您想花費大量精力,否則最好使用FFTW或其他現有實現。
在您的實現中,我擔心這段代碼:
z = u1 * c1 - u2 * c2;
u2 = u1 * c2 + u2 * c1;
u1 = z;
當l1
很大時,(u1,u2)會受到許多累積的舍入誤差的影響。 您可能會得到一個不准確的轉換。
我贊同FFTW的建議,但我相信它是高度特定於平台的。 (大多數FFT庫都是。)[ 編輯 :不,它實際上是直接的C89。 這正是你所說的你想要的。]
Wikipedia FFT頁面列出了一系列適用於奇怪大小的輸入數組的算法。 我不知道它們是如何工作的,但我相信一般的想法是你使用Rader的算法或Bluestein算法進行素數大小的輸入,而Cooley-Tukey則將復合大小的變換用於一堆大小的變換。
對於FFTW的替代方案,請檢查我的mix-radix FFT,它也處理非2 ^ N FFT長度。 C源可從http://www.corix.dk/Mix-FFT/mix-fft.html獲得 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.