标签[curand] - 堆栈内存溢出

管理线程和块之间的多个 cuRAND 序列 - Managing multiple cuRAND sequences between threads and blocks

我正在尝试通过单个 CUDA kernel 调用生成 32 个 64x64 位图。渲染这些图像时，我想随机化每个图像和每个像素的图像生成参数。也就是说，一些随机决策只发生一次并一致地应用于图像中的所有像素，而其他决策是针对每个像素独立做出的。我正在尝试找出一个 cuRAND 设置来启用它。到 ...

用cuda生成独立的随机数数组 - generate independent arrays of random numbers with cuda

我需要生成许多随机数。我找到了很多关于如何生成一组随机数的文档。但是，我需要生成 4 个独立的随机数数组。例如，独立生成 4 向量 (x, y, z, t) 的分量。使用以下代码生成一个数组：我怎样才能生成其他独立的随机数组，比如“y”、“z”和“t”，而它们之间没有任何相关性？我应该为 ...

是否可以在 GPU 上生成 uint64_t 随机数？ - Is it possible to generate uint64_t random numbers on GPU?

我正在尝试通过 GPU 移植有限域 CPU 代码，在此过程中，我想生成随机向量来测试我的函数的速度。我需要两个uint64_t随机向量（以及对应的两个双精度向量，用浮点数表示有限域元素），每个向量的大小为 N。据我所知，GPU 本身不支持 uint64_t 类型，而是使用两个 32 模拟位寄存器 ...

抛出“thrust::system::system_error”实例后调用终止 what(): parallel_for failed: cudaErrorInvalidValue: invalid argument - terminate called after throwing an instance of 'thrust::system::system_error' what(): parallel_for failed: cudaErrorInvalidValue: invalid argument

我正在尝试计算 curand_uniform() 返回 1.0 的次数。但是我似乎无法让以下代码为我工作：我收到终端错误（在 linux 上）：我是这样编译的：我不明白这个错误信息。 ...

memory 分配的顺序在 PyCUDA 的 curandom 中是否重要？ - Does order of memory allocation matter in PyCUDA's curandom?

我在 CUDA Unified Memory [ 2 ] 上使用 PyCUDA 的接口 [ 1 ]。在某些时候，我添加了随机数生成器 [ 3 ] 并盯着 Jupyter Notebook 中的死内核：我将问题缩小到创建随机数生成器。或者，准确地说，到我这样做的那一刻：上面的代码在没有任何 ...

在 CUDA 内核中生成随机数时，cuRAND 的性能比推力差得多 - cuRAND performs much worse than thrust when generating random numbers inside CUDA kernels

我正在尝试使用两种不同的方法从 CUDA __global__内核中的均匀分布中生成“随机”数。第一个是使用cuRAND设备 API，第二个是使用thrust 。对于每种方法，我都创建了一个不同的类。这是我的cuRAND解决方案：这是我的thrust解决方案：我使用它们的方式如下 ...

如何在 PyCuda 的内核中初始化和运行 Mersenne Twister Random Generator - How to initialize and run Mersenne Twister Random Generator inside kernels in PyCuda

我想在 pyCuda 内核中使用 Mersenne Twister 随机生成器进行数值实验。通过 Internet，我没有找到如何做到这一点的简单示例，因此，我尝试从 Cuda 文档和 pyCuda 示例（下面的 pyCuda 代码）构建一些东西。如何正确完成？谢谢你。 ...

PyCUDA curandState的非法内存访问* - PyCUDA illegal memory access of curandState*

我正在研究入侵物种的传播，并尝试使用XORWOW随机数发生器在PyCUDA内核中生成随机数。我需要能够用作研究中的输入的矩阵非常大（最大8,000 x 8,000）。索引XORWOW生成器的curandState*时，似乎在get_random_number内部发生错误。该代码在 ...

cuRAND内核中的随机数生成器的类型 - The type of random number generator in cuRAND kernels

问题“ 如何在pyCUDA内核中生成随机数”中报告了CUDA或pyCUDA中随机数生成的典型示例。，即使用这个经典示例，被激活的随机数生成器是什么（ XORWOW ， MTGP32等）？如何从内核内部更改随机数生成器？ ...

CUDA的Mersenne Twister用于任意数量的线程 - CUDA's Mersenne Twister for an arbitrary number of threads

CUDA的Mersenne Twister （ MT ）随机数生成器的实现被限制为最大线程/块数为256和200块/网格，即最大线程数为51200 。因此，无法启动将MT与哪里 n是线程总数。对threads > 51200使用MT的最佳方法是什么？ ...