繁体 English 中英

CUDA块的最大数量？

[英]Maximum number of CUDA blocks?

原文 2019-04-20 02:30:28 1 1 cuda

我想在CUDA中实现一个算法，该算法接受大小为N的输入，并使用N ^ 2个线程来执行它（这是特定算法单词的方式）。 我被要求制作一个程序，最多可以处理N = 2 ^ 10。 我认为，对于我的系统，给定的线程块最多可以具有512个线程，但是对于N = 2 ^ 10，拥有N ^ 2线程将意味着拥有N ^ 2/1 512 = 2 ^ 20/512块。 我在此链接（ http://www.ce.jhu.edu/dalrymple/classes/602/Class10.pdf ）上看到，您的块数“可以高达65,535（或更大的2 ^ 31-1） ”。

我的问题是：

1）如何找到实际的最大块数？ 我不确定引号^^表示“ 65,535（或更大的2 ^ 31-1）”的含义，因为它们显然是完全不同的数字。

2）是否可以运行需要2 ^ 20/512个线程的算法？

3）如果我需要的线程数（2 ^ 20/512）大于CUDA可以提供的线程数，会发生什么？ 它只是填充所有可用线程，然后在完成计算后将这些线程重新分配给其他等待的任务吗？

4）如果要在每个块中使用最大线程数，是否应该将线程数设置为512，例如<<<number, 512>>> ，还是使用dim3值dim3 ？

如果您能对这些^^问题中的任何一个提供任何见解，我们将不胜感激。

1 个解决方案

如何找到实际的最大块数？ 我不确定引号^^表示“ 65,535（或更大的2 ^ 31-1）”的含义，因为它们显然是完全不同的数字。

阅读相关文档，或构建并运行devicequery实用程序。 但无论哪种情况，限制都远大于2048（2 ^ 20/512等于2048）。 还请注意，当前所有受支持的硬件上的块大小限制为每个块1024个线程，而不是512个线程，因此您可能需要少至1024个块。

是否可以运行需要2 ^ 20/512个线程的算法？

是

如果我需要的线程数量大于CUDA可以提供的数量，那会发生什么？

没有。 发出运行时错误。

它只是填充所有可用线程，然后在完成计算后将这些线程重新分配给其他等待的任务吗？

否。您必须自己明确实现这种方案。

如果要在每个块中使用最大线程数，是否应该将线程数设置为512，例如<<<number, 512>>> ，还是使用dim3值有好处？

没有区别。

GPU/CUDA：网格的最大块数和每个多处理器的最大驻留块数

[英]GPU/CUDA: Maximum number of blocks of a grid and Maximum number of resident blocks per multiprocessor

每个网格的最大块数：CUDA

[英]Maximum blocks per grid:CUDA

CUDA中有最大数量的流吗？

[英]Is there a maximum number of streams in CUDA?

CUDA：网格中的最大块数！= CU_DEVICE_ATTRIBUTE_MAX_GRID_DIM_X？

[英]CUDA: Maximum number of blocks in a grid != CU_DEVICE_ATTRIBUTE_MAX_GRID_DIM_X?

GTX TITAN上的最大块数

[英]Maximum blocks number on a GTX TITAN

块和分配管理中的cuda最大数量

[英]cuda max number in Blocks and allocation manage

CUDA 优化网格步幅循环的块数

[英]CUDA optimise number of blocks for grid stride loop

测量关于块数的cuda执行时间

[英]measure cuda execution time with respect to number of blocks

为什么增加cuda中的方块数量会增加时间？

[英]why increasing the number of blocks in cuda increase the time?

在CUDA中最有效地启动多少个块？

[英]Most efficient number of blocks to launch in CUDA?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 GPU/CUDA：网格的最大块数和每个多处理器的最大驻留块数每个网格的最大块数：CUDA CUDA中有最大数量的流吗？ CUDA：网格中的最大块数！= CU_DEVICE_ATTRIBUTE_MAX_GRID_DIM_X？ GTX TITAN上的最大块数块和分配管理中的cuda最大数量 CUDA 优化网格步幅循环的块数测量关于块数的cuda执行时间为什么增加cuda中的方块数量会增加时间？在CUDA中最有效地启动多少个块？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM