使用numpy和cudamat进行矩阵乘法的结果截然不同

Question

我正在尝试使用numpy和cudamat进行相同的矩阵乘法。

结果是完全不同的。

我究竟做错了什么？

我正在使用：

Ubuntu 14.04
CUDA 7.0-28
英伟达346.46
numpy的1.9.2
Python 2.7.10
Anaconda 2.2.0（64位）
cudamat（最新版本为2015年6月26日）
英伟达750Ti

这是代码：

import numpy as np
import cudamat as cm
cm.init()

...

def distance(self, X):
      gpu_W = cm.CUDAMatrix(self.W)
      gpu_X = cm.CUDAMatrix(X)
      gpu_X2 = cm.pow(gpu_X, 2).sum(axis=1)
      gpu_W2 = cm.pow(gpu_W, 2).sum(axis=1)
      prodWX = cm.dot(gpu_W, gpu_X.T)
      prodWX = prodWX.mult((-2))

      W=self.W
      prodWXgpu=prodWX.asarray()
      prodWXcpu=-2*np.dot(W, X.T)

cm.shutdown()

结果是：

在此处输入图片说明

两者都是二维数组。 它们的形状是：

宽（14,2）X（10000，2）

它意味着每个单元有两个乘法和一个加法。 所以这不应该是因为累积误差

提前致谢

Answer 1

我发现了问题：cm.pow正在修改作为参数接收的矩阵。

为了解决这个问题，我更改了：

gpu_X2 = cm.pow(gpu_X, 2).sum(axis=1)
gpu_W2 = cm.pow(gpu_W, 2).sum(axis=1)

通过：

gpu_X2 = cm.empty (X.shape)
gpu_W2 = cm.empty (W.shape)

cm.pow(gpu_X, 2, target=gpu_X2)
gpu_X2 = gpu_X2.sum(axis=1)
cm.pow(gpu_W, 2, target=gpu_W2)
gpu_W2 = gpu_W2.sum(axis=1)

使用numpy和cudamat进行矩阵乘法的结果截然不同

问题描述

1 个解决方案

解决方案1
0 已采纳 2015-06-28 18:31:29

使用numpy和cudamat进行矩阵乘法的结果截然不同

问题描述

1 个解决方案

解决方案1 0 已采纳 2015-06-28 18:31:29

解决方案1
0 已采纳 2015-06-28 18:31:29