繁体   English   中英

CUFFT双精度

[英]CUFFT Double Precision

我知道以前也曾问过类似的问题,但是我对此很麻烦。 这是我编写的代码:

void fft(const double *indata_real, const double *indata_imag, double *outdata_real, double *outdata_imag, int x, int y)
{
  int size = sizeof(cufftDoubleComplex)*x*y;

  // allocate data on host
  cufftDoubleComplex* host_data = (cufftDoubleComplex*)malloc(size);
  for (int i = 0; i < x*y; ++i) {
    host_data[i].x = indata_real[i];
    host_data[i].y = indata_imag[i];
  }

  // allocate data on device
  cufftDoubleComplex* device_data;
  cudaMalloc((void**)&device_data, size);

  // copy data from host to device
  cudaMemcpy(device_data, host_data, size, cudaMemcpyHostToDevice);

  // create plan
  cufftHandle plan;
  cufftPlan2d(&plan, x, y, CUFFT_Z2Z);

  // perform transform
  cufftExecZ2Z(plan, (cufftDoubleComplex *)device_data, (cufftDoubleComplex *)device_data, CUFFT_FORWARD);

  // copy data back from device to host
  cudaMemcpy(host_data, device_data, size, cudaMemcpyDeviceToHost);

  // copy transform to outdata
  for (int i = 0; i < x*y; ++i) {
    outdata_real[i] = host_data[i].x;
    outdata_imag[i] = host_data[i].y;
  }

  // clean up
  cufftDestroy(plan);
  free(host_data);
  cudaFree(device_data);

}

以上对于单精度工作正常,即当我将所有“ cufftDoubleComplex”替换为“ cufftComplex”,将“ CUFFT_Z2Z”替换为“ CUFFT_C2C”,并将“ cufftExecZ2Z”替换为cufftExecC2C时

根据我在其他页面上找到的内容,我认为这可以以双精度运行良好。 但是目前,outdata数组与indata数组相同-它没有做任何事情。

因此,如果任何人都可以发现我做错了什么,那就太好了!

小号

您的代码未产生任何输出的原因是因为没有任何内容在运行-您的GPU是计算1.1设备,不支持双精度浮点运算。

您应该能够通过检查cufftExecZ2Z调用的返回状态来检查此情况,我希望该返回状态返回CUFFT_EXEC_FAILED因为您的GPU不支持双精度,并且双精度FFT内核将不会启动。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM