[英]valarray in-place operation gives different result as a temporary assignment
以下程序:
#include<iostream>
#include<valarray>
using namespace std;
int main() {
int init[] = {1, 1};
// Example 1
valarray<int> a(init, 2);
// In-place assignment
a[slice(0, 2, 1)] = a[slice(0, 2, 1)] + valarray<int>(a[slice(0, 2, 1)]) * a[0];
for (int k = 0; k < 2; ++ k) {
cout << a[k] << ' '; // Outputs 2 3
}
cout << endl;
// Example 2
valarray<int> b(init, 2);
// Temporary assignment
valarray<int> r = b[slice(0, 2, 1)] + valarray<int>(b[slice(0, 2, 1)]) * b[0];
b[slice(0, 2, 1)] = r;
for (int k = 0; k < 2; ++ k) {
cout << b[k] << ' '; // Outputs 2 2
}
cout << endl;
return 0;
}
输出:
2 3
2 2
正确答案是2 2
( <1 1> + <1 1> * 1 = <2 2>
。为什么内联版本输出的内容有所不同?
以防万一,我以这种方式编译:
g++ myprogram.cpp -o myprogram
g++ -v
的输出是:
Using built-in specs.
COLLECT_GCC=g++
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/5/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 5.4.0-6ubuntu1~16.04.5' --with-bugurl=file:///usr/share/doc/gcc-5/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-5 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.5)
看起来旧的编译器缺少模板重载。 模板
valarray<T>& operator=( valarray<T>&& other ) noexcept;
在VS2017和gcc-7.1中存在,但在较早版本中不存在。 似乎每次迭代都会评估和分配右侧的表达式。 最简单的示例证明了这一点:
#include <iostream>
#include <valarray>
int main()
{
std::valarray<int> a{2, 4, 8};
a = a + a[0];
for (auto n : a)
std::cout << n << " ";
std::cout << std::endl << std::endl;
return 0;
}
正确的输出是:
4 6 10
但是较旧的编译器会产生
4 8 12
解决方案是使用更新的编译器或强制复制
a = std::valarray<int>(a + a[0]);
希望这可以帮助
首先, a[slice(0, 2, 1)]
slice_array<T>
a[slice(0, 2, 1)]
类型为slice_array<T>
,并且没有operator+
将slice_array<T>
对象或引用作为参数的重载。
请注意,可能的工作重载operator+(const valarray<T>&, const valarray<T>&)
是一个函数模板,尽管slice_array<T>
可以隐式转换为valarray<T>
,但模板参数T
不能从slice_array<T>
参数。
因此严格来说,您的代码将导致编译错误。 实际上, Clang确实有 。
其次,您应该知道valarray
操作有一些优化技术。 表达式模板是一种众所周知的技术,它会导致意外的结果。 为了查看其工作原理,让我们考虑一个重现此问题的简单示例:
valarray<int> a{1, 1};
a = a + a[0];
// now a is {2, 3} while {2, 2} is expected
表达式模板的主要思想是将对表达式的评估推迟到真正需要它的值之前,这样可以避免额外的临时性。
在上面的示例中,优化器可以选择将a + a[0]
的结果优化为代理对象,而不是临时valarray<int>
。 代理对象只是存储的动作 (不结果值)“加入a[0]
到a
”。
当代理对象然后被分配到a
时,发生实际的评价。 从存储的操作中,优化器将选择为每个i
分配a[i] + a[0]
到a[i]
。 现在,此分配中的不同评估顺序将导致不同的结果。 例如,如果编译器将a[0] + a[0]
分配给a[0]
,然后将a[1] + a[0]
(此处a[0]
更改为2)分配给a[1]
,将产生意外结果{2, 3}
。
该标准允许此类代理对象存在,但似乎不清楚如何指定代理对象应如何工作。 我个人认为这是一个编译器错误,因为只需评估a[0]
并在赋值之前存储其值即可解决此问题,而性能损失很小。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.