我想在 OpenCL 中做一些实验,我想知道在使用缓冲区从主机代码执行 kernel 期间更改状态的可能性。 我试图通过修改主机代码中的缓冲区值来更改 kernel 代码中 while 循环的 state,但是执行被挂起。 我第二次调用 function clEnqueueWriteBuffer() ...
我想在 OpenCL 中做一些实验,我想知道在使用缓冲区从主机代码执行 kernel 期间更改状态的可能性。 我试图通过修改主机代码中的缓冲区值来更改 kernel 代码中 while 循环的 state,但是执行被挂起。 我第二次调用 function clEnqueueWriteBuffer() ...
在 OpenCL kernel 中,如果针对 NVIDIA GPU,我想做一件事,否则我想做另一件事,即 我应该放什么而不是MAGIC_HERE ? ...
我正在使用 openCL 从头开始编写一个渲染器,我的 kernel 上有一个小编译问题,错误是: CL_BUILD_PROGRAM: error: program scope variable must reside in constant address space static float* ...
在Windows 11上安装NVIDIA GeForce RTX 3060 Ti显卡驱动时,安装了OpenCL 3.0版本。 如何安装 OpenCL 2.0 版? 尝试安装旧版本的 NVIDIA 驱动程序,但它们没有安装在 Windows 11 上。 ...
我正在研究如何在 GPU 上卸载一些相当繁重的计算。 虽然在我的机器上我有一个NVIDIA RTX GPU ,但我想避免使用 CUDA 来开发在其他 GPU 上也可以移植的东西(至少在它的核心)。 因而选择了OpenCL。 现在,我目前最大的担忧是,在适合卸载的内核中,我大量使用了LAPACK S ...
CPU 中的集成 GPU 是否有通过 PCIe 总线传输数据的开销,就像在 CPU 和专用 GPU 之间传输数据一样? 我问这个问题是因为我的 OpenCL GPU 加速计算在集成的 GPU Intel(R) Iris(R) Xe Graphics 上的性能优于专用的 NVIDIA T500 G ...
我想知道如何迭代具有任意数量工作项的循环(每个组无关紧要) 我有 3 个 arrays,其中一个是二维的(矩阵)。 第一个数组包含一组整数。 矩阵填充了另一组(重复和随机)整数。 第三个只是存储结果。 我需要从矩阵中的第一个数组中搜索最远的一对数字出现次数。 总结一下: A:带有随机数的矩阵 nu ...
我正在将一些 CUDA 代码移植到 OpenCL。 CUDA 代码执行如下操作:// CPU code... int data; cudaMemcpyFromSymbol(gpuData, &data, sizeof(int), 0, cudaMemcpyDeviceToHost); ...
我想了解 OpenCL 中的 async_work_group_copy() 是否存在大小限制。 当大小为 10、10000、15000 时,上面的代码将数据从全局 memory 正确复制到本地 memory,但是当我进一步增加大小时,值不匹配。 此外,在所有情况下,我只检查了前 10 个值是否被 ...
我正在做一个使用 OpenCL 的项目,我认为它可以在 Mali 400 GPU 上运行。 但是我最近发现Mali 400 GPU只支持OpenGL ES 2.0标准。 我仍然必须使用这个 GPU,那么有什么方法可以让着色器的行为与 OpenCL 内核或 CUDA 内核几乎相同? 我期望有一些主要 ...
由于 OpenCL 中没有内置随机函数(我不知道,如果这不是真的请指正)。 生成一个放入内核的随机列表对我的工作目的不起作用。 它必须是在 GPU(内核)上运行的随机生成器。 我打算编写自己的函数来生成 0 到 1 范围内的随机数。下面的代码是我在 CPU 上运行的代码,它似乎运行良好。 但是,我 ...
我必须使用 OpenCL 对 Floyd 算法进行编程,它工作正常,但仅适用于 n<268。 当 n>=268 时,我在调用 clEnqueueWriteBuffer(循环中的 buffer_distances 之一)时有一个“访问冲突读取位置”。 这是我的代码: graphe是邻接矩 ...
怎么了我试图在我的.cl代码中包含一些 C 代码以从 kernel 调用。据我所知,编译器可以很好地找到.h文件,但未能包含实现.c文件。 我将 C# 与 OpenCL 一起使用OpenCL.NetCore源代码位于名为cl的文件夹中程序是用这个构建的: Cl.BuildProgram(progr ...
我试图在我的 Windows 机器上编译一个 OpenCL 程序。 我首先发现的是使用#include <CL/cl.h> header,但我似乎没有安装它。 所以看了一会,发现有人推荐用OCL_SDK_Light来包含Windows和AMD GPU上的头文件和库。我安装了它,但由于我不 ...
我正在学习 opencl,出于某种原因 kernel 什么都不做: 我想让它做事,但它没有。 我尝试读取输入而不是 output,一切正常。 kernel 中的 printf 什么都不做,如果我运行它,clEnqueueReadBuffer 只给出 0。我有一个 amd,所以我无法在 cpu 上 ...
正如标题所示,OpenCL API 仅检测到我的英特尔 iGPU,但检测不到 CPU 本身。 关于为什么的任何想法? 我已经通过 package 管理器安装了 Intel-opencl-icd,但它似乎不足以找到 CPU。 对于上下文,这是我到目前为止的代码。 从技术上讲,无法在 CPU 内核上运 ...
被这个问题折磨了好久,请问您的建议是朝哪个方向移动。 目标-在windows上用yolo开发通用应用程序,可以使用AMD/Nvidia/Intel GPU的计算能力,AMD/Intel CPU(其中一个设备将被使用)。 据我所知,OpenCV DNN模块在CPU计算方面领先; DNN + Cud ...
我正在尝试估算在 AMD Radeon RX Vega GPU 上运行的 OpenCL Kernel 的功耗。有没有办法直接通过 OpenCL 访问功耗? 我尝试使用分析器,但找不到支持 amd GPU 或 opencl 的分析器。 所以如果可能的话,我想通过编程来完成 ...
我的 C++ 代码在 Win 10 上运行,自建 OpenCV 4.5.3.,检查了 WITH_OPENCL 标志。 使用 UMat 而不是 Mat 不会通过 OpenCL 的“透明 API”带来任何性能改进。 从我在https://jeanvitor.com/opencv-opencl-umat- ...
我正在尝试在 OpenCL 中转换 CUDA 代码片段。 CUDA 代码: OpenCL 代码: 我对 floor 的结果有一些疑问。 例如,对于坐标点 {12.48,-10.629,-0.223,0.4},X_MIN_RANGE = 0.0,Y_MIN_RANGE = -39.68,PILLA ...