
[英]Check OpenCL vendor ID at kernel-compile-time?
在 OpenCL kernel 中,如果针对 NVIDIA GPU,我想做一件事,否则我想做另一件事,即 我应该放什么而不是MAGIC_HERE ? ...
[英]Check OpenCL vendor ID at kernel-compile-time?
在 OpenCL kernel 中,如果针对 NVIDIA GPU,我想做一件事,否则我想做另一件事,即 我应该放什么而不是MAGIC_HERE ? ...
[英]In NVIDIA gpu, Why is the elapse time the same as the number of thread increase to 3 times of gpu core?
这是我的cuda代码: 我编译我的代码,在2080Ti上运行,我发现线程消耗时间大约是214毫秒,但是线程数是gpu核心的3倍(在2080Ti上是4352) 所以我的问题是为什么运行时间和线程数一样增加到gpu核的3倍? 意思是NVIDIA gpu的计算能力是gpu核心的3倍? ...
[英]In NVIDIA gpu, Can ld/st and arithmetic instruction(such as int32 fp32 )run simultaneously in same sm?
尤其是图灵和安培架构,在同一个sm和同一个warp调度器中,warp是否可以同时运行ld/st等算术指令? 我想知道 warp scheduler 是如何工作的 ...
[英]How to get instruction cost in NVIDIA GPU?
我想知道nvidia gpu有多少时钟指令开销,比如add, mul,ld/st等等,我该怎么做? 我写了一些代码在 2080Ti 上测试和运行 但是结果让我有点疑惑,结果output是: 在 gpu 阶段 1:6 0 为什么执行了这么多次 mul 指令,时钟成本只有 6 ? nvcc 编译器是否 ...
[英]CUDA H.265 decoder initialization fault
我正在尝试使用 nvidia_video_codec_sdk 解码 h.265 帧,视频大小为 192x168,但 cuvidCreateDecoder 断言 CUDA_ERROR_INVALID_VALUE。 我的环境 NVIDIA GeForce RTX 3060 NVIDIA-SMI 470 ...
[英]docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]. AFTER installing nvidia-docker2
我按照官方文档https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html 中的说明安装了 nvidia-docker2 每当我运行他们的测试示例时: 我仍然收到错误: 我重新启动但仍然没有效 ...
[英]Compilation of OpenCV v4.5.1 using CMake on NVIDIA GTX 1660 Super / Windows10
我正在尝试使用 CMake 为我的 1660 Super 编译 OpenCV v4.5.1。 我已经按照 NVIDIA 网站上的说明安装了 CUDA Toolkit v12.0 和 CUDNN v8.7.0.84。 作为记录,我正在按照这些说明进行操作。 我使用自己的Anaconda Python ...
[英]Older driver, newer CUDA Toolkit leads to container startup failure - any configuration workarounds?
从 CUDA 11.x 开始,NVIDIA 理论上应保证其 CUDA 工具包库(通常在 docker 容器内提供)和驱动程序库libcuda.so (安装在主机上)的兼容性。 至少当我们停留在 CUDA(11.0 到 11.8)的所有次要版本中时,这应该是正确的。 因此,应该可以在预装了为旧版 C ...
[英]Parallelization of a for loop consisting of Thrust Transforms
我已经实现了一个由多个 Thrust 转换组成的 for 循环。 我的目标是为i从 0 到N的每个值计算r[i] 。 简单来说, r是一个列向量,它的每一个元素都可以独立计算。 因此,我正在寻找一种并行化下面给出的 for 循环的方法:for(int i=0; i < N; i++) { ...
[英]Vulkan is unable to detect Nvidia GPU from within a docker container when using the Nvidia Container Toolkit
我的目标是能够使用Nvidia Container Toolkit在 docker 容器中运行 Vulkan 应用程序。 理想情况下在主机和容器中运行 Ubuntu 22.04。 我创建了一个 git 存储库以允许其他人更好地重现此问题: https://github.com/rickyjames ...
[英]Where is the NVidia 11.8 WSL Ubuntu toolkit available for download?
在哪里可以下载 wsl2 的 11.8 cuda 工具包? 我需要道德上的等价物:wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda-repo-wsl-ubuntu-12-0-lo ...
[英]How to start triton server after building the Windows 10 "Min" Image?
我已按照此处提到的步骤进行操作。 我能够构建 win10-py3-min 图像。 之后,我正在尝试按照此处所述构建 Triton 服务器命令: 我收到如下错误。 和下面的命令 出现如下错误。 ...
[英]Could not load dynamic library 'libnvinfer.so.7'
我知道这个问题已经被问了很多,但这些建议似乎都没有用,可能是因为我的设置有些不同: 在目录home/dan/anaconda3/envs/tf/lib/python3.10/site-packages/tensorrt中创建了一个 conda 环境 'tf' 当运行python3 -c "impo ...
[英]Change fan speed of NVIDIA GPU via CLI
如何在 Linux 系统上使用终端或命令行界面 (CLI) 更改 NVIDIA 图形处理单元 (GPU) 上冷却风扇的速度或负载? 我有兴趣调整风扇速度或负载以优化我的 GPU 的温度和性能,我想知道是否有任何可用的工具或实用程序允许我通过终端或 CLI 执行此操作。 是否可以直接更改风扇速度或负载 ...
[英]How vulkan application find the address of the function in driver
我正在研究 Vulkan 驱动程序代码。 我想知道应用程序如何调用驱动程序函数,因为函数名称不同。 我想知道应用程序如何调用驱动程序函数,因为函数名称不同。 ...
[英]How to use GPU with TensorFlow?
我的电脑Microsoft Windows [Version 10.0.22621.963] (c) Microsoft Corporation. All rights reserved. C:\Users\donhu>nvcc -V nvcc: NVIDIA (R) Cuda compi ...
[英]Nano Jetson Jetpack 4.6.1 can't install right h5py version?
我有一个 Nano Jetson,并从这里用最新可用的 Jetpack 版本刷新它: https ://developer.nvidia.com/embedded/learn/get-started-jetson-nano-devkit,即 4.6.1。 现在,当按照本指南安装 tensorflo ...
[英]Is there 1 SYCL implementation to rule all platforms?
为这个有点开玩笑的标题道歉,但我找不到另一种方式来简洁地描述这个问题。 我在一个主要使用带有 CPU 回退的 OpenCL 代码的团队中工作。 在大多数情况下,这工作正常,除了 Nvidia 和他们拒绝将 SPIR-V 用于 OpenCL。 我最近发现并一直在研究 SYCL,但围绕它的生态系统有点 ...
[英]How to exclude error mesage from bash string
我的 xubuntu 中有命令: 我得到了结果: 如果我尝试排除“libEGL 警告:DRI2:无法验证”: 结果是一样的。 如何忽略“libEGL 警告:DRI2:无法验证”字符串? ...
[英]Read GPU Information from Console C++
我想创建自己的超频监视器,我需要为其读取当前电压、时钟速度等信息。 在 C++ 中,我可以通过键入轻松地从 Nvidia-smi 获取信息,例如: console("nvidia-smi -q -i voltage"); 然后显示我: 由此我只需要电压编号,在本例中为“806.25”。 我对 < ...