cost 592 ms
gpu 部分检测到,火炬张量未上传到 gpu

[英]gpu partially detected, torch tensor is not uploaded to gpu

检测到我的 gpu 但不在 我使用的代码是: 结果是: 我使用的是 NVIDIA GTX 1070 Ti,Nvidia 显卡驱动 460.89、cuda 11.2、cudnn 8.1.1、torch 1.7.1+cu110、torchvision 0.8.2+cu110。 虽然上面的结果,我的深度 ...

我如何获得 cuML RandomForestClassifier 叶子?

[英]How can I get cuML RandomForestClassifier leafs?

我是cuML的新手,我有一个使用 scikit 学习的决策树分类器。 我想使用 GPU 执行一些超参数搜索,所以我开始寻找cuML 。 cuML 中没有DecisionTreeClassifier ,但据我在其他 SO 帖子中所读,它可以通过使用具有 1 棵树且没有引导程序的RandomFore ...

cuda 代码可以在没有 cudaStreamDestroy() 的情况下完成吗?

[英]can a cuda code finish without cudaStreamDestroy()?

在我们的大型代码库中,我发现有多个cudaStreamCreate()函数。 但是,我在任何地方都找不到cudaStreamDestroy() 。 程序完成后销毁流是否重要,或者不需要担心这一点? 在这方面什么是好的编程实践? ...

2023-01-29 22:05:59   2   45    cuda / gpu  
如何安装旧版本的 OpenCL?

[英]How to install an older version of OpenCL?

在Windows 11上安装NVIDIA GeForce RTX 3060 Ti显卡驱动时,安装了OpenCL 3.0版本。 如何安装 OpenCL 2.0 版? 尝试安装旧版本的 NVIDIA 驱动程序,但它们没有安装在 Windows 11 上。 ...

如何将 GPU 与 Tensorflow 2.11 一起使用?

[英]How to use the GPU with Tensorflow 2.11?

根据此链接://pypi.org/project/tensorflow-gpu/,不再支持“tensorflow-gpu”package,用户应改为使用“tensorflow”package,它应该支持 GPU。 然而,安装 tensorflow 2.11 package 后,它甚至检测不到我的 ...

CUDA_CACHE_DISABLE=1的作用是什么? 请详细说明

[英]What is the role of CUDA_CACHE_DISABLE=1? Please explain in detail

我在 run.sh 文件中看到一些使用 CUDA_CACHE_DISABLE=1 的代码。 但是网站上没有详尽的解释。 我从在线文档中得到的是一些抽象的东西,如下所示: 为即时编译禁用缓存(设置为 1 时)或启用缓存(设置为 0 时)。 禁用时,不会将二进制代码添加到缓存或从缓存中检索。 但什么是二 ...

LNK2005 与 __declspec(dllexport)

[英]LNK2005 with __declspec(dllexport)

我正在编写一个简单的 OpenGL 3D 应用程序。 如果我在笔记本电脑上运行该应用程序,性能会很糟糕,因为始终选择内部 Intel GPU 而不是功能更强大的专用 AMD GPU。 我读到我必须包括这一行以强制应用程序在专用的 GPU 上运行: 但是,我收到一个 LNK2005 错误,指出Amd ...

Pytorch 与 Tensorflow CUDA 版本

[英]Pytorch vs. Tensorflow CUDA Versions

我目前有 Pytorch(版本 1.13.1+cu116)设置。 它检测到 GPU 并与 CUDA 版本 11.6 一起正常工作。 下面是我运行nvidia-smi得到的 output: 我现在正在尝试使用 GPU 支持设置 tensorflow。 但是,它不适用于 CUDA 版本 11.6(使用 ...

std::bad_alloc: out_of_memory: CUDA 导入数据/运行模型时出错

[英]std::bad_alloc: out_of_memory: CUDA error when importing data/running models

我正在尝试将数据集上传到 NVIDA RAPIDS jupyter notebook,但在导入此数据集或在 dask dataframe 上使用 XGBoost 时,此错误不断弹出。训练数据集的大小为 3.7gb。 我只有一个GPU。 一些规格: 中央处理器:i7 9700F @4.00GHz G ...

如何在RStudio中用GPU激活R的手电筒package

[英]How to activate R's torch package with GPU in RStudio

我想在这里运行教程。 https://blogs.rstudio.com/ai/posts/2020-09-29-introducing-torch-for-r/ 安装后 然后当我在我的 RStudio 中激活它时,出现以下错误 我希望它返回: 我知道我的机器中有几个 CUDA 引擎: 和 或者 ...

在虚幻引擎中记录和保存基本 GPU 统计数据的最简单方法?

[英]easiest way to log and save basic GPU stats in Unreal Engine?

在虚幻引擎编辑器中测试时,我需要在文件中记录基本的 GPU 统计数据(计算时间),以便之后分析它们。 最简单的方法是什么? 我正在使用 UE 5.1 对蓝图没有偏好,解决方案可以使用或不使用蓝图。 我不需要记录同步事件(如果它们也被添加也没关系,我只是不需要它们)。 随着时间的推移,我只需要简单的 ...

CPU 中的集成 GPU 是否有通过 PCIe 总线传输数据的开销,就像在 CPU 和专用 GPU 之间传输数据一样?

[英]Do integrated GPUs in CPUs have the overhead of transferring data over the PCIe bus just like transferring data between CPU and dedicated GPU?

CPU 中的集成 GPU 是否有通过 PCIe 总线传输数据的开销,就像在 CPU 和专用 GPU 之间传输数据一样? 我问这个问题是因为我的 OpenCL GPU 加速计算在集成的 GPU Intel(R) Iris(R) Xe Graphics 上的性能优于专用的 NVIDIA T500 G ...

请使用 torch.load 和 map_location=torch.device('cpu') 到 map 你的存储到 CPU

[英]please use torch.load with map_location=torch.device('cpu') to map your storages to the CPU

当我尝试运行此代码块时,出现以下问题: RuntimeError:尝试在 CUDA 设备上反序列化 object,但 torch.cuda.is_available() 为 False。 如果你在一台只有 CPU 的机器上运行,请使用 torch.load 和 map_location=torc ...

CUDA里面有kernel队列启用GPU吗?

[英]Is there a kernel queue inside CUDA enabled GPU?

当多个 PyTorch 进程在同一个 Nvidia GPU 上运行推理时。我想知道当来自不同上下文的两个 kernel 请求(cuLaunchKernel)由 CUDA 处理时会发生什么? CUDA GPU 可以为那些 kernel 请求创建 FIFO 队列吗? 在运行我的 PyTorch 程序 ...

在NVIDIA gpu中,为什么运行时间随着线程数增加到gpu核心的3倍?

[英]In NVIDIA gpu, Why is the elapse time the same as the number of thread increase to 3 times of gpu core?

这是我的cuda代码: 我编译我的代码,在2080Ti上运行,我发现线程消耗时间大约是214毫秒,但是线程数是gpu核心的3倍(在2080Ti上是4352) 所以我的问题是为什么运行时间和线程数一样增加到gpu核的3倍? 意思是NVIDIA gpu的计算能力是gpu核心的3倍? ...

实现混合功能对于固定功能混合来说过于复杂

[英]Implementing blending functions too complicated for fixed-function blending

我正在尝试在 gpu 上实现高级混合。但是每当我尝试搜索资源时,我都会被顺序独立渲染、片段着色器互锁等术语弄得不知所措。 而且我不知道哪些与我的问题相关。 简单地给出 3 个对象,( b0 , b1 , b2 ),它们都位于同一个像素上并具有特定的 z 顺序。 (您可以假设对象已正确排序)。 那么 ...

NVIDIA GPU 如何获取指令成本?

[英]How to get instruction cost in NVIDIA GPU?

我想知道nvidia gpu有多少时钟指令开销,比如add, mul,ld/st等等,我该怎么做? 我写了一些代码在 2080Ti 上测试和运行 但是结果让我有点疑惑,结果output是: 在 gpu 阶段 1:6 0 为什么执行了这么多次 mul 指令,时钟成本只有 6 ? nvcc 编译器是否 ...

如何在加载另一个数据集时清理 GPU memory

[英]How to clean GPU memory when loading another dataset

我在比较两种类型的输入数据(3 秒和 30 秒)的音频频谱图上训练 CNN.network。 这导致实验中不同的频谱图大小。 我正在使用它来获取数据:def get_data(data_type, batch_size): assert data_type in ['3s', '30s'] ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM