簡體   English   中英

如何用 CUDA 計算大矩陣的二維 FFT?

[英]How to calculate a two-dimensional FFT of a large matrix with CUDA?

現在我有一個16K*16K的大矩陣,全局memory是不夠的。如何計算矩陣的二維FFT?

也許使用統一的 memory 超額訂閱適用於 cuFFT?

https://developer.nvidia.com/blog/unified-memory-cuda-beginners/

您還可以分別對行和列執行 FFT,並在主機 memory 之間移動數據。

您需要完整的結果矩陣嗎? 你在 CPU 和 GPU 上有多少 memory? 輸入/輸出是復數值嗎? 您需要什么精度(16 位是否足夠)? 計算時間緊迫嗎? 您還想處理更大的矩陣嗎?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM