标签[cuda-events] - 堆栈内存溢出

如果 cuEventRecord 获得默认流的句柄，它保证做什么？ - What is cuEventRecord guaranteed to do if it gets the default-stream's handle?

假设我调用cuEventRecord(0, my_event_handle) 。 cuEventRecord()要求 stream 和事件属于同一上下文。现在，可以将0解释为“在适当的上下文中的默认值 stream”——满足要求，这应该可以工作；但也可以将其解释为“当前上下文中的默认 str ...

重用 cudaEvent 序列化多个流 - Reusing cudaEvent to serialize multiple streams

假设我有一个结构： function：以及以下场景（狮子、女巫和衣柜也适合某个地方）：以上安全吗？即如果stream2本身没有工作，它仍然会等待stream1完成它的“工作”吗？结果记录的cudaEvent会反映这一点，使得stream3在stream1完成之前不会启动？ ...

使用 cudaEventRecord() 为多 GPU 程序记录 CUDA 内核的运行时间 - Recording elapsed time of CUDA kernels with cudaEventRecord() for multi-GPU program

我有一个稀疏三角形求解器，可与 4 个 Tesla V100 GPU 配合使用。我完成了实施，一切都在准确性方面运作良好。但是，我使用 CPU 计时器来计算经过的时间。我知道 CPU 计时器不是计算经过时间的完美选择，因为我可以使用 CUDA 事件。但问题是，我不知道如何为多 GPU 实现 ...

CUDA流中CUDA事件的异步行为 - Asynchronous behavior of CUDA events within a CUDA stream

这个问题是关于CUDA流（流）的概念以及流上记录的CUDA事件（事件）的明显异常。考虑下面的代码演示了这一点，由于Stream上的所有工作都是顺序的，因此以下事件序列应该已经发生， “ eventStart ”被记录为完整 kernel1运行并完成记 ...

cudaEventRecord是否受当前设备身份的影响？ - Is cudaEventRecord affected by the identity of the current device?

cudaEventRecord 将事件ID和流ID作为参数。 Runtime API参考没有说明是否需要将流与当前设备关联-并且我无法测试是否是这种情况，因为在我现在可以访问的任何系统上最多只有一个GPU。假设它必须是当前设备上的流：如果在另一台设备上获得流，会发生什么？ ...

CUDA中流的非阻塞同步？ - Non-blocking synchronization of streams in CUDA?

是否可以在不阻塞主机的情况下同步两个CUDA流？我知道有cudaStreamWaitEvent ，它是非阻塞的。但是如何使用cudaEventCreate和cudaEventDestroy创建和销毁事件cudaEventDestroy ？ cudaEventDestroy的文档说： ...

是否可以从设备端代码中触发CUDA事件？ - Can a CUDA event be fired from device-side code?

有什么方法可以从CUDA中的设备内核触发事件（出于基准测试的目的，类似于CPU代码中的cudaEvents）？例如，假设我想测量从内核启动到开始计算的第一个线程所经过的时间，以及从离开计算到CPU返回的最后一个线程所经过的时间。我可以那样做吗？ ...

如何取消设置CUDA事件？ - How can I unset a CUDA event?

我在主机上有一个处理循环，在其中将事件记录在GPU流中。然后另一个流等待该事件（等待事件的状态“设置”或“真”）。此函数（cudaStreamWaitEvent）是否会取消设置此事件（因此，将其切换为“未设置”或“假”）？如果没有，我可以使用什么CUDA函数来取消设置此事件？ ...

等待后续流中的事件 - Wait for event in subsequent stream

我正在尝试使用CUDA在GPU上实现以下类型的管道：我有四个流，每个流都有一个Host2Device副本，一个内核调用和一个Device2Host副本。但是，内核调用必须等待下一个流的Host2Device副本完成。我打算将cudaStreamWaitEvent用于同步。 ...

cudaStreamWaitEvent 似乎没有等待 - cudaStreamWaitEvent does not seem to wait

我正在尝试编写一个小型演示程序，其中有两个 cuda 流正在进行，并且受事件控制，彼此等待。到目前为止，这个程序看起来像这样：我对 CUDA 流的掌握如下： stream 是一种我可以添加任务的列表。这些任务是按顺序处理的。所以在我的程序中，我可以 rest 保证 streamA 会按顺序致 ...

cudaStreamWaitEvent会阻止主机吗？ - Will cudaStreamWaitEvent block the host?

我知道cudaEventSynchronize将阻止主机，直到事件被触发。但是，cudaStreamWaitEvent怎么样？ cudaStreamWaitEvent是否仅阻止指定的流，而主机将继续，或者主机也将被阻止？ ...