cost 64 ms
管理线程和块之间的多个 cuRAND 序列 - Managing multiple cuRAND sequences between threads and blocks

我正在尝试通过单个 CUDA kernel 调用生成 32 个 64x64 位图。 渲染这些图像时,我想随机化每个图像和每个像素的图像生成参数。 也就是说,一些随机决策只发生一次并一致地应用于图像中的所有像素,而其他决策是针对每个像素独立做出的。 我正在尝试找出一个 cuRAND 设置来启用它。 到 ...

2022-12-25 19:07:05   1   31    cuda / curand  
用cuda生成独立的随机数数组 - generate independent arrays of random numbers with cuda

我需要生成许多随机数。 我找到了很多关于如何生成一组随机数的文档。 但是,我需要生成 4 个独立的随机数数组。 例如,独立生成 4 向量 (x, y, z, t) 的分量。 使用以下代码生成一个数组: 我怎样才能生成其他独立的随机数组,比如“y”、“z”和“t”,而它们之间没有任何相关性? 我应该为 ...

是否可以在 GPU 上生成 uint64_t 随机数? - Is it possible to generate uint64_t random numbers on GPU?

我正在尝试通过 GPU 移植有限域 CPU 代码,在此过程中,我想生成随机向量来测试我的函数的速度。 我需要两个uint64_t随机向量(以及对应的两个双精度向量,用浮点数表示有限域元素),每个向量的大小为 N。据我所知,GPU 本身不支持 uint64_t 类型,而是使用两个 32 模拟位寄存器 ...

抛出“thrust::system::system_error”实例后调用终止 what(): parallel_for failed: cudaErrorInvalidValue: invalid argument - terminate called after throwing an instance of 'thrust::system::system_error' what(): parallel_for failed: cudaErrorInvalidValue: invalid argument

我正在尝试计算 curand_uniform() 返回 1.0 的次数。 但是我似乎无法让以下代码为我工作: 我收到终端错误(在 linux 上): 我是这样编译的: 我不明白这个错误信息。 ...

memory 分配的顺序在 PyCUDA 的 curandom 中是否重要? - Does order of memory allocation matter in PyCUDA's curandom?

我在 CUDA Unified Memory [ 2 ] 上使用 PyCUDA 的接口 [ 1 ]。 在某些时候,我添加了随机数生成器 [ 3 ] 并盯着 Jupyter Notebook 中的死内核: 我将问题缩小到创建随机数生成器。 或者,准确地说,到我这样做的那一刻: 上面的代码在没有任何 ...

在 CUDA 内核中生成随机数时,cuRAND 的性能比推力差得多 - cuRAND performs much worse than thrust when generating random numbers inside CUDA kernels

我正在尝试使用两种不同的方法从 CUDA __global__内核中的均匀分布中生成“随机”数。 第一个是使用cuRAND设备 API,第二个是使用thrust 。 对于每种方法,我都创建了一个不同的类。 这是我的cuRAND解决方案: 这是我的thrust解决方案: 我使用它们的方式如下 ...

如何在 PyCuda 的内核中初始化和运行 Mersenne Twister Random Generator - How to initialize and run Mersenne Twister Random Generator inside kernels in PyCuda

我想在 pyCuda 内核中使用 Mersenne Twister 随机生成器进行数值实验。 通过 Internet,我没有找到如何做到这一点的简单示例,因此,我尝试从 Cuda 文档和 pyCuda 示例(下面的 pyCuda 代码)构建一些东西。 如何正确完成? 谢谢你。 ...


排序:
质量:
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM