標簽[nvidia] - 堆棧內存溢出

[英]Check OpenCL vendor ID at kernel-compile-time?

在 OpenCL kernel 中，如果針對 NVIDIA GPU，我想做一件事，否則我想做另一件事，即我應該放什么而不是MAGIC_HERE ？ ...

[英]In NVIDIA gpu， Why is the elapse time the same as the number of thread increase to 3 times of gpu core？

這是我的cuda代碼：我編譯我的代碼，在2080Ti上運行，我發現線程消耗時間大約是214毫秒，但是線程數是gpu核心的3倍（在2080Ti上是4352）所以我的問題是為什么運行時間和線程數一樣增加到gpu核的3倍？意思是NVIDIA gpu的計算能力是gpu核心的3倍？ ...

在NVIDIA gpu中，ld/st和算術指令（比如int32 fp32）可以在同一個sm中同時運行嗎？

[英]In NVIDIA gpu， Can ld/st and arithmetic instruction（such as int32 fp32 ）run simultaneously in same sm?

尤其是圖靈和安培架構，在同一個sm和同一個warp調度器中，warp是否可以同時運行ld/st等算術指令？我想知道 warp scheduler 是如何工作的 ...

NVIDIA GPU 如何獲取指令成本？

[英]How to get instruction cost in NVIDIA GPU？

我想知道nvidia gpu有多少時鍾指令開銷，比如add, mul，ld/st等等，我該怎么做？我寫了一些代碼在 2080Ti 上測試和運行但是結果讓我有點疑惑，結果output是：在 gpu 階段 1:6 0 為什么執行了這么多次 mul 指令，時鍾成本只有 6 ？ nvcc 編譯器是否 ...

CUDA H.265解碼器初始化故障

[英]CUDA H.265 decoder initialization fault

我正在嘗試使用 nvidia_video_codec_sdk 解碼 h.265 幀，視頻大小為 192x168，但 cuvidCreateDecoder 斷言 CUDA_ERROR_INVALID_VALUE。我的環境 NVIDIA GeForce RTX 3060 NVIDIA-SMI 470 ...

docker：來自守護程序的錯誤響應：無法 select 具有功能的設備驅動程序“”：[[gpu]]。安裝 nvidia-docker2 之后

[英]docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]. AFTER installing nvidia-docker2

我按照官方文檔https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html 中的說明安裝了 nvidia-docker2 每當我運行他們的測試示例時：我仍然收到錯誤：我重新啟動但仍然沒有效 ...

在NVIDIA GTX 1660 Super / Windows10上使用CMake編譯OpenCV v4.5.1

[英]Compilation of OpenCV v4.5.1 using CMake on NVIDIA GTX 1660 Super / Windows10

我正在嘗試使用 CMake 為我的 1660 Super 編譯 OpenCV v4.5.1。我已經按照 NVIDIA 網站上的說明安裝了 CUDA Toolkit v12.0 和 CUDNN v8.7.0.84。作為記錄，我正在按照這些說明進行操作。我使用自己的Anaconda Python ...

較舊的驅動程序，較新的 CUDA 工具包導致容器啟動失敗 - 任何配置解決方法？

[英]Older driver, newer CUDA Toolkit leads to container startup failure - any configuration workarounds?

從 CUDA 11.x 開始，NVIDIA 理論上應保證其 CUDA 工具包庫（通常在 docker 容器內提供）和驅動程序庫libcuda.so （安裝在主機上）的兼容性。至少當我們停留在 CUDA（11.0 到 11.8）的所有次要版本中時，這應該是正確的。因此，應該可以在預裝了為舊版 C ...

由推力變換組成的 for 循環的並行化

[英]Parallelization of a for loop consisting of Thrust Transforms

我已經實現了一個由多個 Thrust 轉換組成的 for 循環。我的目標是為i從 0 到N的每個值計算r[i] 。簡單來說， r是一個列向量，它的每一個元素都可以獨立計算。因此，我正在尋找一種並行化下面給出的 for 循環的方法：for(int i=0; i < N; i++) { ...

使用 Nvidia 容器工具包時，Vulkan 無法從 docker 容器中檢測到 Nvidia GPU

[英]Vulkan is unable to detect Nvidia GPU from within a docker container when using the Nvidia Container Toolkit

我的目標是能夠使用Nvidia Container Toolkit在 docker 容器中運行 Vulkan 應用程序。理想情況下在主機和容器中運行 Ubuntu 22.04。我創建了一個 git 存儲庫以允許其他人更好地重現此問題： https://github.com/rickyjames ...

在哪里可以下載 NVidia 11.8 WSL Ubuntu 工具包？

[英]Where is the NVidia 11.8 WSL Ubuntu toolkit available for download?

在哪里可以下載 wsl2 的 11.8 cuda 工具包？我需要道德上的等價物：wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda-repo-wsl-ubuntu-12-0-lo ...

構建 Windows 10“Min”圖像后如何啟動 triton 服務器？

[英]How to start triton server after building the Windows 10 "Min" Image?

我已按照此處提到的步驟進行操作。我能夠構建 win10-py3-min 圖像。之后，我正在嘗試按照此處所述構建 Triton 服務器命令：我收到如下錯誤。和下面的命令出現如下錯誤。 ...

無法加載動態庫“libnvinfer.so.7”

[英]Could not load dynamic library 'libnvinfer.so.7'

我知道這個問題已經被問了很多，但這些建議似乎都沒有用，可能是因為我的設置有些不同：在目錄home/dan/anaconda3/envs/tf/lib/python3.10/site-packages/tensorrt中創建了一個 conda 環境 'tf' 當運行python3 -c "impo ...

通過 CLI 更改 NVIDIA GPU 的風扇速度

[英]Change fan speed of NVIDIA GPU via CLI

如何在 Linux 系統上使用終端或命令行界面 (CLI) 更改 NVIDIA 圖形處理單元 (GPU) 上冷卻風扇的速度或負載？我有興趣調整風扇速度或負載以優化我的 GPU 的溫度和性能，我想知道是否有任何可用的工具或實用程序允許我通過終端或 CLI 執行此操作。是否可以直接更改風扇速度或負載 ...

vulkan 應用程序如何在驅動程序中找到函數的地址

[英]How vulkan application find the address of the function in driver

我正在研究 Vulkan 驅動程序代碼。我想知道應用程序如何調用驅動程序函數，因為函數名稱不同。我想知道應用程序如何調用驅動程序函數，因為函數名稱不同。 ...

如何在 TensorFlow 中使用 GPU？

[英]How to use GPU with TensorFlow?

Nano Jetson Jetpack 4.6.1 無法安裝正確的 h5py 版本？

[英]Nano Jetson Jetpack 4.6.1 can't install right h5py version?

我有一個 Nano Jetson，並從這里用最新可用的 Jetpack 版本刷新它： https ://developer.nvidia.com/embedded/learn/get-started-jetson-nano-devkit，即 4.6.1。現在，當按照本指南安裝 tensorflo ...

是否有 1 個 SYCL 實現來統治所有平台？

[英]Is there 1 SYCL implementation to rule all platforms?

為這個有點開玩笑的標題道歉，但我找不到另一種方式來簡潔地描述這個問題。我在一個主要使用帶有 CPU 回退的 OpenCL 代碼的團隊中工作。在大多數情況下，這工作正常，除了 Nvidia 和他們拒絕將 SPIR-V 用於 OpenCL。我最近發現並一直在研究 SYCL，但圍繞它的生態系統有點 ...

如何從 bash 字符串中排除錯誤信息

[英]How to exclude error mesage from bash string

我的 xubuntu 中有命令：我得到了結果：如果我嘗試排除“libEGL 警告：DRI2：無法驗證”：結果是一樣的。如何忽略“libEGL 警告：DRI2：無法驗證”字符串？ ...

從控制台 C++ 讀取 GPU 信息

[英]Read GPU Information from Console C++

我想創建自己的超頻監視器，我需要為其讀取當前電壓、時鍾速度等信息。在 C++ 中，我可以通過鍵入輕松地從 Nvidia-smi 獲取信息，例如： console("nvidia-smi -q -i voltage"); 然后顯示我：由此我只需要電壓編號，在本例中為“806.25”。我對 &lt ...