cost 120 ms
如果 cuEventRecord 获得默认流的句柄,它保证做什么? - What is cuEventRecord guaranteed to do if it gets the default-stream's handle?

假设我调用cuEventRecord(0, my_event_handle) 。 cuEventRecord()要求 stream 和事件属于同一上下文。 现在,可以将0解释为“在适当的上下文中的默认值 stream”——满足要求,这应该可以工作; 但也可以将其解释为“当前上下文中的默认 str ...

使用 cudaEventRecord() 为多 GPU 程序记录 CUDA 内核的运行时间 - Recording elapsed time of CUDA kernels with cudaEventRecord() for multi-GPU program

我有一个稀疏三角形求解器,可与 4 个 Tesla V100 GPU 配合使用。 我完成了实施,一切都在准确性方面运作良好。 但是,我使用 CPU 计时器来计算经过的时间。 我知道 CPU 计时器不是计算经过时间的完美选择,因为我可以使用 CUDA 事件。 但问题是,我不知道如何为多 GPU 实现 ...

cudaEventRecord是否受当前设备身份的影响? - Is cudaEventRecord affected by the identity of the current device?

cudaEventRecord 将事件ID和流ID作为参数 。 Runtime API参考没有说明是否需要将流与当前设备关联-并且我无法测试是否是这种情况,因为在我现在可以访问的任何系统上最多只有一个GPU。 假设它必须是当前设备上的流: 如果在另一台设备上获得流,会发生什么? ...

如何取消设置CUDA事件? - How can I unset a CUDA event?

我在主机上有一个处理循环,在其中将事件记录在GPU流中。 然后另一个流等待该事件(等待事件的状态“设置”或“真”)。 此函数(cudaStreamWaitEvent)是否会取消设置此事件(因此,将其切换为“未设置”或“假”)? 如果没有,我可以使用什么CUDA函数来取消设置此事件? ...

等待后续流中的事件 - Wait for event in subsequent stream

我正在尝试使用CUDA在GPU上实现以下类型的管道: 我有四个流,每个流都有一个Host2Device副本,一个内核调用和一个Device2Host副本。 但是,内核调用必须等待下一个流的Host2Device副本完成。 我打算将cudaStreamWaitEvent用于同步。 ...

cudaStreamWaitEvent 似乎没有等待 - cudaStreamWaitEvent does not seem to wait

我正在尝试编写一个小型演示程序,其中有两个 cuda 流正在进行,并且受事件控制,彼此等待。 到目前为止,这个程序看起来像这样: 我对 CUDA 流的掌握如下: stream 是一种我可以添加任务的列表。 这些任务是按顺序处理的。 所以在我的程序中,我可以 rest 保证 streamA 会按顺序致 ...


排序:
质量:
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM