[英]Fail to create filters in OpenCV GPU (CUDA)
系统信息(版本)
详细说明
我正在使用基于 GPU 的功能和操作。 我自己构建了支持 CUDA 的 OpenCV,大多数 GPU 功能和操作都运行良好。 但是当涉及到像createGaussianFilter
或createSobelFilter
这样的过滤器相关函数时,会捕获以下异常:
C:\OpenCV\opencv-3.2.0\modules\cudafilters\src\filtering.cpp:414: error: (-215) rowFilter_:= 0 in function `anonymous-namespace'::SeparableLinearFilter::SeparableLinearFilter
重现代码
// C++ code example
// A very simple snnipet
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/core/cuda.hpp>
#include <opencv2/cudaimgproc.hpp>
#include <opencv2/cudafilters.hpp>
#include <iostream>
using namespace cv;
using namespace std;
int main(int argc, char** argv)
{
try
{
Ptr<cuda::Filter> filterX = cuda::createSobelFilter(CV_64F, CV_64F, 1, 0, 3, 1, BORDER_DEFAULT); // x direction
}
catch (cv::Exception& e)
{
const char* err_msg = e.what();
std::cout << "exception caught: " << err_msg << std::endl;
}
return 0;
}
您可以在此处找到用于测试 CUDA 版本的 Sober 过滤器的代码。
在我看来,这是 OpenCV 开发人员的选择(CUDA API 允许双精度计算,因为我认为很长一段时间以来)。 CV_64F
或双精度浮点不被接受,因为效率较低且精度更高不值得性能下降。 计算机图形学不需要这种精度,因此 GPU 架构具有更多的单精度单位(更多信息, 2010 年)。
另请参阅 CUDA常见问题解答。
注意:游戏 GPU 与专业 GPU 尤其如此(参见此处,2015 年):
NVIDIA GPU 总结
NVIDIA 的 GTX 系列以其出色的 FP32 性能而闻名,但其 FP64 性能却很差。 性能通常介于 1:24(开普勒)和 1:32(麦克斯韦)之间。 例外情况是 GTX Titan 卡,它模糊了消费类 GTX 系列和专业 Tesla/Quadro 卡之间的界限。
Kepler 架构的 Quadro 和 Tesla 系列卡以 1:3 FP32 提供完整的双精度性能。 然而,对于 Quadro M6000,NVIDIA 决定只提供最低限度的 FP64 性能,只提供 1:32 的 FP32 性能,并宣称 M6000 是最好的显卡,而不是像 Quadro K6000 这样的最好的图形+计算卡。
AMD 显卡
与 FP32 相比,AMD GPU 在 FP64 方面的表现相当出色。 大多数 AMD 卡(包括消费类/游戏系列)将为 FP64 提供 1:3 到 1:8 的 FP32 性能。 此处在这些基准测试中测试的 AMD Tahiti 架构不会遇到与 NVIDIA 的 GTX 系列相同的 FP64 问题,并提供 1:4 的性能。 较新的 Hawaii 架构消费级 GPU 有望提供 1:8 的性能。
FirePro W9100、W8100 和 S9150 将为您提供令人难以置信的 FP64 1:2 FP32 性能。
总体而言,与 NVIDIA 同类产品相比,AMD GPU 以出色的双精度性能比而著称。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.