cost 355 ms
如何在 fortran 代码中包含 cufft.h 文件? - How do I include cufft.h file in a fortran code?

我有一个 Fortran 代码,可以在 CPU 上运行,但我需要使用 GPU 加速它,我选择使用 OpenACC 来实现。 此代码在使用 gfortran 编译时使用 FFTW 库。 但是,您可能知道,这些库不能与 nvfortran 一起使用。 所以,我必须 go 与 cufft 图书馆。 因此 ...

如何解释 cuFFT R2C 结果 - How to interpret cuFFT R2C result

我正在使用 GPU 加速一些数据分析代码,目前正在 numpy.fft 库和 cuFFT(使用 skcuda.fft 包装器)之间进行一些分析和比较。 我确定我只是错过了一些关于 cuFFT 中 FFT 实现的明显内容,但我很难在 cuFFT 文档中找到它。 为了解决这个问题,我创建了 500 ms ...

cuda fortran 袖口PlanMany - cuda fortran cufftPlanMany

我在使用 cufftPlanMany 时遇到问题。 创建计划并进行正向和反向 FFT 后,我无法取回原始数据。 请在附件中找到代码的最低版本。 问题是在我进行了正向和反向 FFT 之后,我无法取回原始数据。 请问,我做错了什么? 数据的顺序应该是eta_d(batch,nx,ny,nz) or e ...

列方向的 cuFFT - cuFFT in column direction

我有一个 nx * ny 的复矩阵。 我只想在列方向上执行 FFT。 一种方法是转置整个矩阵,然后使用 cufftPlan1d 获得 FFT。 有没有其他有效的方法可以在不进行矩阵转置的情况下获得 FFT。 cufftPlanMany 将有助于在列方向获得 fft。 例如,让我们假设 nx = 8 ...

2019-12-21 08:09:36   1   223    cuda / cufft  
用袖带实现实到复 FFT - In place real to complex FFT with cufft

我正在尝试使用 cufft 执行就地真实到复杂的 FFT。 我知道类似的问题How to perform a Real to Complex Transformation with cuFFT 。 但是,我在尝试重现相同的方法时遇到问题。 如果我做一个不合适的转换,没有问题,但是一旦我做到位,我在 ...

2019-11-12 15:39:09   1   267    c++ / cuda / cufft  
如何使用Scikit-cuda FFT调度多个1d FFT? - How to schedule multiple 1d FFTs using Scikit-cuda FFT?

我正在寻找使用CUDA并行化多个1d FFT的方法。 我正在使用CUDA 6.1开发GTX 1050Ti。 例如,在我附带的代码中,我有一个3d输入数组“数据”,并且我想对该数组的第二维进行1d FFT。 当然,目的是将执行时间缩短一个数量级。 我能够使用Python的sciki ...

从设备复制到主机时,cudaMemcpy 抛出 InvalidValue 错误 - cudaMemcpy throws InvalidValue error when copying from device to host

我一直在尝试使用 cuFFT 实现一维 FFT。 抛出 InvalidValue 错误,并且不会产生任何有意义的结果。 我试图确保捕获每个错误,并且我相信来自 DeviceToHost 的 cudaMemcpy 会导致该问题,但我不确定为什么,也不知道如何解决它。 cudaMemcpy 中的数据 ...

skcuda.fft与numpy.fft.rfft不同吗? - skcuda.fft not the same as numpy.fft.rfft?

我试图将ftf的输出与numpy的ftf进行测试以进行单元测试,但我意识到在失败后不久,这并不是因为我做错了什么,但是skcuda实际上并不会产生相同的答案。 我知道它们会有所不同,但是至少其中一个数字与numpy产生的结果allclose几个数量级,并且allclose和almost_equ ...

为什么cufft的输入和输出与传统的fft有很大不同? - Why does the input and output for cufft greatly differ from traditional fft?

从我对fft函数的理解(例如,从类似这样的问题开始 ) 假设1D fft,给定N点实际数据,对于零频率,我将得到长度为N(但为复数)+1的双面fft。 如果我采用相同的fft输出,并对其执行ifft,则将获得N个实数值,在理想情况下,这将与fft的原始输入完全匹配。 在cufft中 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM