繁体 English 中英

带矩阵乘法的sse精度误差

[英]sse precision error with Matrix multiplication

原文 2014-05-11 16:28:29 5 1 c/ sse/ precision/ matrix-multiplication/ rounding-error

我的程序执行NxN个矩阵乘法，其中两个矩阵的元素都使用for循环初始化为值（0，1，2，... N）。 两个矩阵元素均为float类型。 没有内存分配问题。 输入的矩阵大小为4的倍数，例如：4x4或8x8等。答案通过顺序计算进行验证。 一切正常，直到矩阵大小为64x64。 仅当矩阵大小超过64（例如：68 x 68）时，才能观察到顺序版本和SSE版本之间的差异。

SSE代码段如下所示（大小= 68）：

void matrix_mult_sse(int size, float *mat1_in, float *mat2_in, float *ans_out) { __m128 a_line, b_line, r_line; int i, j, k; for (k = 0; k < size * size; k += size) { for (i = 0; i < size; i += 4) { j = 0; b_line = _mm_load_ps(&mat2_in[i]); a_line = _mm_set1_ps(mat1_in[j + k]); r_line = _mm_mul_ps(a_line, b_line); for (j = 1; j < size; j++) { b_line = _mm_load_ps(&mat2_in[j * size + i]); a_line = _mm_set1_ps(mat1_in[j + k]); r_line = _mm_add_ps(_mm_mul_ps(a_line, b_line), r_line); } _mm_store_ps(&ans_out[i + k], r_line); } } }

这样，答案在元素3673上有所不同，在这里我得到乘法的答案如下

标量：576030144.000000＆ SSE ：576030208.000000

我还用相同的初始化和设置用Java编写了一个类似的程序，N = 68，对于元素3673，我得到的答案为576030210.000000。

现在有三个不同的答案，我不确定如何继续。 为什么会出现这种差异？如何消除这种差异？

1 个解决方案

我正在总结讨论，以结束已回答的问题。

所以根据文章（什么每台计算机科学家应该知道关于浮点运算）的链接，浮点总是导致一个舍入误差是的浮点数的近似表示性质的直接后果。

诸如加，减之类的算术运算会导致精度误差。 因此，浮点答案的6个最高有效数字 （无论小数点位于何处）都可以被认为是准确的，而其他数字则可能是错误的（容易出现精度错误）。

使用SSE进行矩阵乘法

[英]Matrix Multiplication Using SSE

SSE矩阵-矩阵乘法

[英]SSE matrix-matrix multiplication

使用SSE错误__m128到* float转换的矩阵乘法？

[英]Matrix Multiplication Using SSE Error __m128 to *float conversion?

使用SSE内在函数的矩阵乘法

[英]Matrix multiplication using SSE intrinsics

通过SSE2加速矩阵乘法

[英]speed up Matrix Multiplication by SSE2

使用SSE向量指令加速矩阵矩阵乘法

[英]Speed up matrix-matrix multiplication using SSE vector instructions

使用SSE内在函数进行大小为100 * 100的矩阵乘法

[英]Matrix Multiplication of size 100*100 using SSE Intrinsics

Pthreads矩阵乘法错误

[英]Pthreads matrix multiplication error

C中的矩阵乘法误差

[英]Matrix Multiplication Error in C

矩阵乘法中的分割错误

[英]Segmentation Error in Matrix Multiplication

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用SSE进行矩阵乘法 SSE矩阵-矩阵乘法使用SSE错误__m128到* float转换的矩阵乘法？使用SSE内在函数的矩阵乘法通过SSE2加速矩阵乘法使用SSE向量指令加速矩阵矩阵乘法使用SSE内在函数进行大小为100 * 100的矩阵乘法 Pthreads矩阵乘法错误 C中的矩阵乘法误差矩阵乘法中的分割错误

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM