cost 86 ms
在NVIDIA gpu中,為什么運行時間隨着線程數增加到gpu核心的3倍?

[英]In NVIDIA gpu, Why is the elapse time the same as the number of thread increase to 3 times of gpu core?

這是我的cuda代碼: 我編譯我的代碼,在2080Ti上運行,我發現線程消耗時間大約是214毫秒,但是線程數是gpu核心的3倍(在2080Ti上是4352) 所以我的問題是為什么運行時間和線程數一樣增加到gpu核的3倍? 意思是NVIDIA gpu的計算能力是gpu核心的3倍? ...

NVIDIA GPU 如何獲取指令成本?

[英]How to get instruction cost in NVIDIA GPU?

我想知道nvidia gpu有多少時鍾指令開銷,比如add, mul,ld/st等等,我該怎么做? 我寫了一些代碼在 2080Ti 上測試和運行 但是結果讓我有點疑惑,結果output是: 在 gpu 階段 1:6 0 為什么執行了這么多次 mul 指令,時鍾成本只有 6 ? nvcc 編譯器是否 ...

CUDA H.265解碼器初始化故障

[英]CUDA H.265 decoder initialization fault

我正在嘗試使用 nvidia_video_codec_sdk 解碼 h.265 幀,視頻大小為 192x168,但 cuvidCreateDecoder 斷言 CUDA_ERROR_INVALID_VALUE。 我的環境 NVIDIA GeForce RTX 3060 NVIDIA-SMI 470 ...

docker:來自守護程序的錯誤響應:無法 select 具有功能的設備驅動程序“”:[[gpu]]。 安裝 nvidia-docker2 之后

[英]docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]. AFTER installing nvidia-docker2

我按照官方文檔https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html 中的說明安裝了 nvidia-docker2 每當我運行他們的測試示例時: 我仍然收到錯誤: 我重新啟動但仍然沒有效 ...

在NVIDIA GTX 1660 Super / Windows10上使用CMake編譯OpenCV v4.5.1

[英]Compilation of OpenCV v4.5.1 using CMake on NVIDIA GTX 1660 Super / Windows10

我正在嘗試使用 CMake 為我的 1660 Super 編譯 OpenCV v4.5.1。 我已經按照 NVIDIA 網站上的說明安裝了 CUDA Toolkit v12.0 和 CUDNN v8.7.0.84。 作為記錄,我正在按照這些說明進行操作。 我使用自己的Anaconda Python ...

較舊的驅動程序,較新的 CUDA 工具包導致容器啟動失敗 - 任何配置解決方法?

[英]Older driver, newer CUDA Toolkit leads to container startup failure - any configuration workarounds?

從 CUDA 11.x 開始,NVIDIA 理論上應保證其 CUDA 工具包庫(通常在 docker 容器內提供)和驅動程序庫libcuda.so (安裝在主機上)的兼容性。 至少當我們停留在 CUDA(11.0 到 11.8)的所有次要版本中時,這應該是正確的。 因此,應該可以在預裝了為舊版 C ...

由推力變換組成的 for 循環的並行化

[英]Parallelization of a for loop consisting of Thrust Transforms

我已經實現了一個由多個 Thrust 轉換組成的 for 循環。 我的目標是為i從 0 到N的每個值計算r[i] 。 簡單來說, r是一個列向量,它的每一個元素都可以獨立計算。 因此,我正在尋找一種並行化下面給出的 for 循環的方法:for(int i=0; i < N; i++) { ...

使用 Nvidia 容器工具包時,Vulkan 無法從 docker 容器中檢測到 Nvidia GPU

[英]Vulkan is unable to detect Nvidia GPU from within a docker container when using the Nvidia Container Toolkit

我的目標是能夠使用Nvidia Container Toolkit在 docker 容器中運行 Vulkan 應用程序。 理想情況下在主機和容器中運行 Ubuntu 22.04。 我創建了一個 git 存儲庫以允許其他人更好地重現此問題: https://github.com/rickyjames ...

無法加載動態庫“libnvinfer.so.7”

[英]Could not load dynamic library 'libnvinfer.so.7'

我知道這個問題已經被問了很多,但這些建議似乎都沒有用,可能是因為我的設置有些不同: 在目錄home/dan/anaconda3/envs/tf/lib/python3.10/site-packages/tensorrt中創建了一個 conda 環境 'tf' 當運行python3 -c "impo ...

通過 CLI 更改 NVIDIA GPU 的風扇速度

[英]Change fan speed of NVIDIA GPU via CLI

如何在 Linux 系統上使用終端或命令行界面 (CLI) 更改 NVIDIA 圖形處理單元 (GPU) 上冷卻風扇的速度或負載? 我有興趣調整風扇速度或負載以優化我的 GPU 的溫度和性能,我想知道是否有任何可用的工具或實用程序允許我通過終端或 CLI 執行此操作。 是否可以直接更改風扇速度或負載 ...

2022-12-24 17:07:41   1   12    nvidia  
vulkan 應用程序如何在驅動程序中找到函數的地址

[英]How vulkan application find the address of the function in driver

我正在研究 Vulkan 驅動程序代碼。 我想知道應用程序如何調用驅動程序函數,因為函數名稱不同。 我想知道應用程序如何調用驅動程序函數,因為函數名稱不同。 ...

是否有 1 個 SYCL 實現來統治所有平台?

[英]Is there 1 SYCL implementation to rule all platforms?

為這個有點開玩笑的標題道歉,但我找不到另一種方式來簡潔地描述這個問題。 我在一個主要使用帶有 CPU 回退的 OpenCL 代碼的團隊中工作。 在大多數情況下,這工作正常,除了 Nvidia 和他們拒絕將 SPIR-V 用於 OpenCL。 我最近發現並一直在研究 SYCL,但圍繞它的生態系統有點 ...

如何從 bash 字符串中排除錯誤信息

[英]How to exclude error mesage from bash string

我的 xubuntu 中有命令: 我得到了結果: 如果我嘗試排除“libEGL 警告:DRI2:無法驗證”: 結果是一樣的。 如何忽略“libEGL 警告:DRI2:無法驗證”字符串? ...

從控制台 C++ 讀取 GPU 信息

[英]Read GPU Information from Console C++

我想創建自己的超頻監視器,我需要為其讀取當前電壓、時鍾速度等信息。 在 C++ 中,我可以通過鍵入輕松地從 Nvidia-smi 獲取信息,例如: console("nvidia-smi -q -i voltage"); 然后顯示我: 由此我只需要電壓編號,在本例中為“806.25”。 我對 &lt ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM