cost 77 ms
在NVIDIA gpu中,为什么运行时间随着线程数增加到gpu核心的3倍?

[英]In NVIDIA gpu, Why is the elapse time the same as the number of thread increase to 3 times of gpu core?

这是我的cuda代码: 我编译我的代码,在2080Ti上运行,我发现线程消耗时间大约是214毫秒,但是线程数是gpu核心的3倍(在2080Ti上是4352) 所以我的问题是为什么运行时间和线程数一样增加到gpu核的3倍? 意思是NVIDIA gpu的计算能力是gpu核心的3倍? ...

NVIDIA GPU 如何获取指令成本?

[英]How to get instruction cost in NVIDIA GPU?

我想知道nvidia gpu有多少时钟指令开销,比如add, mul,ld/st等等,我该怎么做? 我写了一些代码在 2080Ti 上测试和运行 但是结果让我有点疑惑,结果output是: 在 gpu 阶段 1:6 0 为什么执行了这么多次 mul 指令,时钟成本只有 6 ? nvcc 编译器是否 ...

CUDA H.265解码器初始化故障

[英]CUDA H.265 decoder initialization fault

我正在尝试使用 nvidia_video_codec_sdk 解码 h.265 帧,视频大小为 192x168,但 cuvidCreateDecoder 断言 CUDA_ERROR_INVALID_VALUE。 我的环境 NVIDIA GeForce RTX 3060 NVIDIA-SMI 470 ...

docker:来自守护程序的错误响应:无法 select 具有功能的设备驱动程序“”:[[gpu]]。 安装 nvidia-docker2 之后

[英]docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]. AFTER installing nvidia-docker2

我按照官方文档https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html 中的说明安装了 nvidia-docker2 每当我运行他们的测试示例时: 我仍然收到错误: 我重新启动但仍然没有效 ...

在NVIDIA GTX 1660 Super / Windows10上使用CMake编译OpenCV v4.5.1

[英]Compilation of OpenCV v4.5.1 using CMake on NVIDIA GTX 1660 Super / Windows10

我正在尝试使用 CMake 为我的 1660 Super 编译 OpenCV v4.5.1。 我已经按照 NVIDIA 网站上的说明安装了 CUDA Toolkit v12.0 和 CUDNN v8.7.0.84。 作为记录,我正在按照这些说明进行操作。 我使用自己的Anaconda Python ...

较旧的驱动程序,较新的 CUDA 工具包导致容器启动失败 - 任何配置解决方法?

[英]Older driver, newer CUDA Toolkit leads to container startup failure - any configuration workarounds?

从 CUDA 11.x 开始,NVIDIA 理论上应保证其 CUDA 工具包库(通常在 docker 容器内提供)和驱动程序库libcuda.so (安装在主机上)的兼容性。 至少当我们停留在 CUDA(11.0 到 11.8)的所有次要版本中时,这应该是正确的。 因此,应该可以在预装了为旧版 C ...

由推力变换组成的 for 循环的并行化

[英]Parallelization of a for loop consisting of Thrust Transforms

我已经实现了一个由多个 Thrust 转换组成的 for 循环。 我的目标是为i从 0 到N的每个值计算r[i] 。 简单来说, r是一个列向量,它的每一个元素都可以独立计算。 因此,我正在寻找一种并行化下面给出的 for 循环的方法:for(int i=0; i < N; i++) { ...

使用 Nvidia 容器工具包时,Vulkan 无法从 docker 容器中检测到 Nvidia GPU

[英]Vulkan is unable to detect Nvidia GPU from within a docker container when using the Nvidia Container Toolkit

我的目标是能够使用Nvidia Container Toolkit在 docker 容器中运行 Vulkan 应用程序。 理想情况下在主机和容器中运行 Ubuntu 22.04。 我创建了一个 git 存储库以允许其他人更好地重现此问题: https://github.com/rickyjames ...

无法加载动态库“libnvinfer.so.7”

[英]Could not load dynamic library 'libnvinfer.so.7'

我知道这个问题已经被问了很多,但这些建议似乎都没有用,可能是因为我的设置有些不同: 在目录home/dan/anaconda3/envs/tf/lib/python3.10/site-packages/tensorrt中创建了一个 conda 环境 'tf' 当运行python3 -c "impo ...

通过 CLI 更改 NVIDIA GPU 的风扇速度

[英]Change fan speed of NVIDIA GPU via CLI

如何在 Linux 系统上使用终端或命令行界面 (CLI) 更改 NVIDIA 图形处理单元 (GPU) 上冷却风扇的速度或负载? 我有兴趣调整风扇速度或负载以优化我的 GPU 的温度和性能,我想知道是否有任何可用的工具或实用程序允许我通过终端或 CLI 执行此操作。 是否可以直接更改风扇速度或负载 ...

2022-12-24 17:07:41   1   12    nvidia  
vulkan 应用程序如何在驱动程序中找到函数的地址

[英]How vulkan application find the address of the function in driver

我正在研究 Vulkan 驱动程序代码。 我想知道应用程序如何调用驱动程序函数,因为函数名称不同。 我想知道应用程序如何调用驱动程序函数,因为函数名称不同。 ...

是否有 1 个 SYCL 实现来统治所有平台?

[英]Is there 1 SYCL implementation to rule all platforms?

为这个有点开玩笑的标题道歉,但我找不到另一种方式来简洁地描述这个问题。 我在一个主要使用带有 CPU 回退的 OpenCL 代码的团队中工作。 在大多数情况下,这工作正常,除了 Nvidia 和他们拒绝将 SPIR-V 用于 OpenCL。 我最近发现并一直在研究 SYCL,但围绕它的生态系统有点 ...

如何从 bash 字符串中排除错误信息

[英]How to exclude error mesage from bash string

我的 xubuntu 中有命令: 我得到了结果: 如果我尝试排除“libEGL 警告:DRI2:无法验证”: 结果是一样的。 如何忽略“libEGL 警告:DRI2:无法验证”字符串? ...

从控制台 C++ 读取 GPU 信息

[英]Read GPU Information from Console C++

我想创建自己的超频监视器,我需要为其读取当前电压、时钟速度等信息。 在 C++ 中,我可以通过键入轻松地从 Nvidia-smi 获取信息,例如: console("nvidia-smi -q -i voltage"); 然后显示我: 由此我只需要电压编号,在本例中为“806.25”。 我对 &lt ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM