cost 38 ms
构建 PyTorch 项目时无法连接到 GPU

在此之前,我可以通过 CUDA 运行时版本10.2连接到 GPU。 但是后来我在设置我的一个项目时遇到了一个错误。 经过一番阅读,似乎sm_86仅适用于 CUDA 11.0及以上版本。 这就是为什么我升级到最新的CUDA版本之后无法连接到GPU的原因。 我尝试了很多方法,重新安装了 cuda 工 ...

2022-01-24 09:55:19 0 7
WSL2 中错误的 Cuda 版本

这可能是一个微不足道的问题:我按照官方指南在 WSL2 中安装了 cuda 11.4。 Ubuntu 是 20.04。 现在我想使用需要 cuda 版本 >= 10.2 的 CuPy。 但是,Cupy 安装失败,因为它检测到 cuda 10.1。 当我手动检查 cuda 版本时,使用 nvc ...

2022-01-24 09:53:01 0 10
Tensorflow 无法使用多个 GPU

标题说明了一切。 我已经在网上广泛查看了所有解决方案和方法,但似乎没有一个可以为我解决这个问题 我在 Linux HPC 上工作,所以我没有管理员权限。 HPC 上安装了 15 个 GPU。 我使用从 keras.utils 导入的“multi_gpu_model”命令来使用我们的 4 个 gpu ...

2022-01-23 18:10:15 0 6
无法在 Xavier NX 上安装 CUDA

我最近购买了 Jetson Xavier NX 载板,下载 CUDA 时遇到问题。 我已按照 NVIDIA 网站上的官方步骤安装 CUDA,但安装总是以 2 个问题结束: 无处不在的依赖关系 如果我关闭电路板然后我就无法再打开它我猜我正在安装的 CUDA 正在损坏 NVIDIA 图形驱动程序 ...

2022-01-23 17:26:37 0 2
在 GPU 上添加十亿个数字的最有效算法是什么?

我试图以最省时的方式将 GPU 上十亿个二进制数组的所有元素添加到一个数字中,而现在我知道如何做到这一点的唯一方法是通过并行前缀和。 我知道我可以使用其他算法(即令人尴尬的并行),但我不知道哪个是最省时的选择,也不知道如何实际实现该算法。 任何带有一点伪代码的答案都会令人惊叹。 ...

2022-01-23 17:14:53 0 9
CUDA - 无效的 __global__ 写入大小为 4

我已经在 Cuda 中实现了 Mandelbrot 集。 当我输入附加代码中存在的高度和宽度时,我通过运行 cuda-memcheck 命令得到了这个错误。 它是由什么引起的? 我认为这可能是由于输出结果向量的索引索引溢出错误,但我不明白为什么在这种情况下会出现错误,并且当我输入其他值时,这不会发生 ...

2022-01-23 17:01:55 1 12
Cuda + qt qml 应用程序已编译但未运行

使用 cmake 成功编译 cuda+qt 项目后,在执行第一个 cuda 命令期间遇到以下运行时错误: “main.cpp @ 114。错误代码:2 错误字符串:内存不足” 此外,我验证没有 Cuda 问题我创建了另一个没有 QT 的应用程序,它在同一系统上运行正常 我在 2 个系统上测试了 ...

2022-01-23 14:22:23 0 4
"RuntimeError: CUDA runtime implicit initialization on GPU:0 failed.<\/i> RuntimeError: GPU:0 上的 CUDA 运行时隐式初始化失败。<\/b> Status: device kernel image is invalid<\/i>状态:设备内核映像无效<\/b>"

我使用的环境是: aws p4dn.24xlarge 实例(NVIDIA Ampere A100 GPU) 库达 10.1 张量流 2.3.0 蟒蛇 3.6.9 运行以下命令时出现错误。 是什么原因? 我需要将 CUDA 版本更改为 11 吗? 但是我想尽可能的在cuda10 ...

2022-01-23 08:05:34 0 6
"Julia CUDA - 减少矩阵列"

考虑以下内核,它沿二维矩阵的行减少 除了沿(二维矩阵的)列减少之外,我如何编写类似的内核? 特别是,我如何获取每一列的索引,类似于我们如何使用row_idx每一行的索引? ...

2022-01-21 18:13:22 1 20
如何评估每秒整数运算

我开发了一种用于计数排序的 cuda 算法: 我正在尝试计算该算法每秒的整数运算次数。 因此,要获得整数运算的总数,我假设我只需要计算count变量上的加法运算。 所以我建立了这个方法: 此方法计算算法中发生了多少count变量增量,但我有一个问题:我是否需要在循环中包含j变量的增量数,就像 ...

2022-01-21 10:06:46 0 29
将 CUDA 计算能力确定为 __launch_bounds__ 的 constexpr

为了有效地启动 CUDA 内核,我想使用__launch_bounds__的参数,这些参数取决于当前 GPU 中允许的每个 SM 的最大线程数,而这又取决于该 GPU 的计算能力。 一种方法是通过从cudaGetDeviceProperties返回的cudaDeviceProp结构。 不幸的是,那 ...

2022-01-21 00:29:51 0 13
尝试在 hashcat 上强制 WPA2 握手时出现“分隔符不匹配”

我正在测试一种可能更现实的方法来暴力破解我的网络密码,因为我的密码不在 rockyou 单词列表中。 所以,我认为使用 hashcat 进行暴力破解是一个好方法。 在 powershell 终端中,我运行了以下命令: 作为这个命令的结果,我得到了输出: 我对 hashcat 很陌生,所以当 ...

2022-01-20 20:21:35 0 4
共享服务器上 Pytorch 开发的最佳实践

在共享研究深度学习服务器上运行时,处理不同版本的 Python、Pytorch、CUDA 的最佳方法是什么? 目前我们有一个 Docker 镜像,整个团队都使用它作为基线。 个人用户 pip 安装他们可能需要的任何其他/更新的软件包。 这张图片早就应该用更新版本的 Pytorch 进行更新了,我们 ...

2022-01-20 15:37:40 0 13

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM