使用SSE错误__m128到* float转换的矩阵乘法？

Question

我正在尝试使用SSE本征编程矩阵乘法。 我不确定我的代码是否正确，并且因为出现错误而无法编译它：

Error   1   error C2440: 'type cast' : cannot convert from 'float' to '__m128 *

有人可以仔细检查我的程序，以使我的矩阵乘法正确吗？ 还要注意，这是针对方矩阵的。

这是我的代码。

void Intrinsics (float * matrix_a, float * matrix_b, float * matrix_result, const int num_row, const int num_col) {
    __declspec(align(16)) float * a = matrix_a;
    __declspec(align(16)) float * b = matrix_b;
    __declspec(align(16)) float * c = matrix_result;

    for(int i = 0; i < num_row; ++i)
    {
       for(int j = 0; j < num_col; ++j)
        {
            __m128 *m3 = (__m128*)a[i];     // The error is here.
            __m128 *m4 = (__m128*)b[j];
            float* res;
            *(c + (j * num_col + i)) = 0;
          for(int k = 0; k < num_col; k += 4)
            {
                __m128 m5 = _mm_mul_ps(*m3,*m4);
                res = (float*)&m5;
                *(c + (j * num_col + i)) += res[0]+res[1]+res[2]+res[3];
                m3++;
                m4++;
            }
        }
    }
}

Answer 1

我假设它是__m128 *m3 = (__m128*)a[i]; 之后的那一行会产生错误。 您正在尝试将float类型转换为指向 __m128的指针，该编译器值得抱怨。

我不知道预期算法的细节。 假设目的是作为单个__m128访问四个浮点数a [i] .. a [i + 3]，则需要类似以下内容：

__m128 *m3 = (__m128*)&a[i];
__m128 *m4 = (__m128*)&b[j];

或同等学历：

__m128 *m3 = (__m128*)(a + i);
__m128 *m4 = (__m128*)(b + j);

使用SSE错误__m128到* float转换的矩阵乘法？

问题描述

1 个解决方案

解决方案1
1 2014-04-18 18:49:41

使用SSE错误__m128到* float转换的矩阵乘法？

问题描述

1 个解决方案

解决方案1 1 2014-04-18 18:49:41

解决方案1
1 2014-04-18 18:49:41