在BLAS中使用较少的矩阵

Question

我对BLAS相当陌生（将OpenBLAS与C ++和VisualStudio结合使用）

我知道dgemm执行C < -alpha * op（A）* op（B）+ beta * C

我正在尝试为此保存一些分配： B <-1 * op（A）* op（B）+ 0 * B

换句话说，将结果放入B矩阵中

但是使beta = 0并在C的位置重复B会导致答案为零。

有没有办法做到这一点？

我正在使用的代码：

double* A = new double [3*3]; //3 rows x 3 columns

A[0] = 8;
A[1] = 3;
A[2] = 4;
A[3] = 1;
A[4] = 5;
A[5] = 9;
A[6] = 6;
A[7] = 7;
A[8] = 2;

double* v = new double[3]; //3 rows x 1 column

v[0] = 3;
v[1] = 5;
v[2] = 2;

double* foo = new double[3]; //3 rows x 1 column

cblas_dgemm(CblasColMajor, CblasNoTrans, CblasNoTrans,
    3, 1, 3,
    1,
    A, 3,
    v, 3,
    0,
    foo, 3); // makes foo = [41 ; 48 ; 61], **right**

cblas_dgemm(CblasColMajor, CblasTrans, CblasTrans,
    3, 1, 3,
    1,
    A, 3,
    v, 3,
    0,
    v, 3); // makes v = [0 ; 0 ; 0], **wrong**

Answer 1

BLAS dgemm功能文档指出，只有C矩阵参数同时用于输入和输出，并被运算结果覆盖。 由于仅将B定义为输入，因此BLAS实现可以假定不应对其进行修改。

将B和C设置为相同的数据指针可能会触发您正在使用的实现的一些错误验证，并返回清零的结果来表明这一点。

在BLAS中使用较少的矩阵

问题描述

1 个解决方案

解决方案1
0 已采纳 2016-10-09 22:09:24

在BLAS中使用较少的矩阵

问题描述

1 个解决方案

解决方案1 0 已采纳 2016-10-09 22:09:24

解决方案1
0 已采纳 2016-10-09 22:09:24