SSE内在函数：屏蔽浮点数并使用按位和？

Question

基本上，问题是有关，你必须要设置为零或使用数字本身的一些 x86汇编and 。 如果你and负一个号码，你回来本身的数量，但是，如果你and它与零你为零。

现在我对SSE instrinsics的问题是浮点数和二进制数不一样（或者我错了）。 无论如何这里的代码，我已经尝试使用各种浮动来掩盖第二和第三个数字（分别为127.0f和99.0f），但没有运气。

#include <xmmintrin.h>
#include <stdio.h>

void print_4_bit_num(const char * label, __m128 var)
{
    float *val = (float *) &var;
    printf("%s: %f %f %f %f\n",
       label, val[3], val[2], val[1], val[0]);
}
int main()
{
    __m128 v1 = _mm_set_ps(1.0f, 127.0f,  99.0f, 1.0f);
    __m128 v2 = _mm_set_ps(1.0f, 65535.0f, 127.0f, 0.0f);
    __m128 v = _mm_and_ps(v1, v2);

    print_4_bit_num("v1", v1);
    print_4_bit_num("v2", v2);
    print_4_bit_num("v ", v);

    return 0;
}

Answer 1

在AND时需要使用按位（整数）掩码，因此要清除向量中的替换值，可以执行以下操作：

__m128 v1 = _mm_set_ps(1.0f, 127.0f,  99.0f, 1.0f);
__m128 v2 = _mm_castsi128_ps(_mm_set_epi32(0, -1, 0, -1));
__m128 v = _mm_and_ps(v1, v2); // => v = { 0.0f, 127.0f, 0.0f, 1.0f }

Answer 2

您可以将任何SSE向量转换为相同大小（128位或256位）的任何SSE向量类型，并且您将获得与以前完全相同的位 ; 没有任何实际的代码。 显然，如果你将4浮点数转换为2倍，你会得到废话，但是对于你的情况你将浮点数转换为某种整数类型，然后执行和，将结果转换回来。

Answer 3

如果你有SSE4.1（我打赌你这样做），你应该考虑_mm_blendv_ps(a,b,mask) 。 这只使用其mask参数的符号位，并基本上实现了矢量化mask<0?b:a 。

SSE内在函数：屏蔽浮点数并使用按位和？

问题描述

3 个解决方案

解决方案1
4 已采纳 2014-12-15 14:24:16

解决方案2
3 2014-12-15 14:18:22

解决方案3
0 2014-12-15 14:43:40

SSE内在函数：屏蔽浮点数并使用按位和？

问题描述

3 个解决方案

解决方案1 4 已采纳 2014-12-15 14:24:16

解决方案2 3 2014-12-15 14:18:22

解决方案3 0 2014-12-15 14:43:40

解决方案1
4 已采纳 2014-12-15 14:24:16

解决方案2
3 2014-12-15 14:18:22

解决方案3
0 2014-12-15 14:43:40