为什么在使用CUDA时使用memset？

Question

我在CUDA代码示例中看到， memset用于将向量初始化为全0，以存储其他两个向量的和。 例如：

hostRef = (float *)malloc(nBytes);
gpuRef = (float *)malloc(nBytes);    
memset(hostRef, 0, nBytes);
memset(gpuRef, 0, nBytes);

如果对这些向量不做任何其他处理，这有什么目的？

您可以在此处查看代码： https : //books.google.com/books?id=Jgx_BAAAQBAJ&pg=PA42#v=onepage&q&f=false

不知道链接将工作多长时间。

Answer 1

当您使用'malloc'获取内存时，它不一定为空，只有'calloc'会为您将内存清零。 建议出于完整性和调试目的初始化内存。

Answer 2

如果对这些向量不做任何其他处理，将毫无用处，但事实并非如此。

该代码运行CUDA向量和，然后将结果复制到*gpuRef 。 然后，它在主机CPU上执行相同的总和，并将结果放入*hostRef 。 最后，它比较了两个结果。

当然，在将新数据复制到其中之前，它不会对任何一个数组执行任何操作，因此将初始化初始化为零仍然没有用。

Answer 3

这是njuffa在评论中给出的答案：

... GPU内存的内容在应用程序的调用之间不会改变。 如果程序失败，我们将希望避免从前一次运行中获得良好的数据，这可能导致（错误地）认为程序执行良好。 我在现实生活中已经看到过这样的情况，这对受影响的程序员非常困惑。 因此，最好将结果数据初始化为一个已知值，尽管我会选择0xff而不是0，因为这对应于浮点数据的NaN模式。

为什么在使用CUDA时使用memset？

问题描述

3 个解决方案

解决方案1
1 2015-05-30 01:11:11

解决方案2
1 2015-05-30 01:30:36

解决方案3
1 已采纳 2015-05-31 22:56:40

为什么在使用CUDA时使用memset？

问题描述

3 个解决方案

解决方案1 1 2015-05-30 01:11:11

解决方案2 1 2015-05-30 01:30:36

解决方案3 1 已采纳 2015-05-31 22:56:40

解决方案1
1 2015-05-30 01:11:11

解决方案2
1 2015-05-30 01:30:36

解决方案3
1 已采纳 2015-05-31 22:56:40