C ++：使用矢量/数组优化速度？

Question

我有一个嵌套的for循环结构，现在我在每次迭代开始时重新声明向量：

void function (n1,n2,bound,etc){

    for (int i=0; i<bound; i++){
             vector< vector<long long> > vec(n1, vector<long long>(n2));
             //about three more for-loops here
    }
}

这允许我在每次迭代时“重新开始”，这很有效，因为我的内部操作主要是以vec [a] [b] + =某个值的形式。 但我担心大n1或大n2的速度很慢。 我不知道vector / arrays / etc的底层架构，所以我不确定处理这种情况的最快方法是什么。 我应该使用数组吗？ 我应该以不同方式清除它吗 我应该完全不同地处理逻辑吗？

编辑：矢量的大小在技术上不会改变每次迭代（但它可能会根据函数参数而改变）。 我只是试图清除它/ etc，因此在所有其他情况下，程序的速度与人类一样快。

编辑：

我的不同方法的结果：

Timings (for a sample set of data):
reclaring vector method: 111623 ms
clearing/resizing method: 126451 ms
looping/setting to 0 method: 88686 ms

Answer 1

我明确偏爱小范围（即如果只在那里使用，则在最内层循环中声明变量）但对于大尺寸，这可能会导致大量分配。

因此，如果此循环是性能问题，请尝试在循环外声明变量并仅在循环内清除它 - 但是，这仅在向量的（保留）大小保持相同时才有利。 如果要调整向量的大小，那么无论如何都会得到重新分配。

不要使用原始数组 - 它不会给你带来任何好处，只会带来麻烦。

Answer 2

以下是一些测试几种不同方法的代码。

#include <chrono>
#include <iostream>
#include <vector>

int main()
{
  typedef std::chrono::high_resolution_clock clock;

  unsigned n1 = 1000;
  unsigned n2 = 1000;

  // Original method
  {
    auto start = clock::now();
    for (unsigned i = 0; i < 10000; ++i)
    {
      std::vector<std::vector<long long>> vec(n1, std::vector<long long>(n2));
      // vec is initialized to zero already

      // do stuff
    }
    auto elapsed_time = clock::now() - start;

    std::cout << elapsed_time.count() << std::endl;
  }


  // reinitialize values to zero at every pass in the loop
  {
    auto start = clock::now();
    std::vector<std::vector<long long>> vec(n1, std::vector<long long>(n2));
    for (unsigned i = 0; i < 10000; ++i)
    {
      // initialize vec to zero at the start of every loop
      for (unsigned j = 0; j < n1; ++j)
        for (unsigned k = 0; k < n2; ++k)
            vec[j][k] = 0;

      // do stuff
    }
    auto elapsed_time = clock::now() - start;

    std::cout << elapsed_time.count() << std::endl;
  }

  // clearing the vector this way is not optimal since it will destruct the
  // inner vectors
  {
    auto start = clock::now();
    std::vector<std::vector<long long>> vec(n1, std::vector<long long>(n2));
    for (unsigned i = 0; i < 10000; ++i)
    {
      vec.clear();
      vec.resize(n1, std::vector<long long>(n2));

      // do stuff
    }
    auto elapsed_time = clock::now() - start;

    std::cout << elapsed_time.count() << std::endl;
  }

  // equivalent to the second method from above
  // no performace penalty
  {
    auto start = clock::now();
    std::vector<std::vector<long long>> vec(n1, std::vector<long long>(n2));
    for (unsigned i = 0; i < 10000; ++i)
    {
      for (unsigned j = 0; j < n1; ++j)
      {
        vec[j].clear();
        vec[j].resize(n2);
      }

      // do stuff
    }
    auto elapsed_time = clock::now() - start;

    std::cout << elapsed_time.count() << std::endl;
  }
}

编辑：我已经更新了代码，以便在方法之间进行更公平的比较。 编辑2 ：稍微清理一下代码，方法2或4是要走的路。

以下是我的计算机上面四种方法的时间：

关键是你应该尝试不同的方法并分析你的代码。

Answer 3

选择容器时，我通常使用此图表来帮助我：

在此输入图像描述

资源

除此之外，

像之前发布的那样，如果这导致性能问题，请在for循环之外声明容器，并在每次迭代开始时清除它

Answer 4

为什么不是这样的：

{
    vector< vector<long long> > vec(n1, vector<long long>(n2));

    for (int i=0; i<bound; i++){

         //about three more for-loops here

         vec.clear();
    }
}

编辑：添加范围括号;-)

Answer 5

除了之前的评论：

如果你使用Robinson的交换方法，你可以通过异步处理这个交换来加快速度。

Answer 6

好吧，如果你真的关心性能（你事先知道n1和n2的大小）但不想使用C风格的数组， std::array可能是你的朋友。

编辑：鉴于你的编辑，似乎std::array不是一个合适的替代，因为虽然矢量大小不会改变每次迭代，但在编译之前它仍然是未知的。

Answer 7

由于你必须在每次迭代时将向量值重置为0，实际上，这个问题归结为“与循环内的计算相比，为向量分配和释放内存的成本便宜或昂贵”。

假设计算是算法的昂贵部分，那么编码它的方式既清晰，简洁，显示预期的范围，并且可能与替代方法一样快。

但是，如果您的计算和更新非常快并且向量的分配/释放相对昂贵，则可以使用std::fill在每次迭代结束/开始循环时将零填充回数组。

当然，唯一可以确定的方法是使用分析器进行测量。 我怀疑你会发现你所采用的方法不会显示为任何类型的热点，你应该留下明显的代码。

Answer 8

使用向量与数组的开销很小，尤其是当您从向量中获得许多有用的功能时。 在内部，向量分配一个数组。 所以矢量是要走的路。

C ++：使用矢量/数组优化速度？

问题描述

8 个解决方案

解决方案1
12 2012-04-13 13:23:50

解决方案2
10 已采纳 2012-04-13 13:48:57

解决方案3
6

解决方案4
0 2012-04-13 13:28:42

解决方案5
0 2012-04-13 13:28:57

解决方案6
0 2012-04-13 13:31:00

解决方案7
0 2012-04-13 14:40:32

解决方案8
-1 2012-04-13 13:25:35

C ++：使用矢量/数组优化速度？

问题描述

8 个解决方案

解决方案1 12 2012-04-13 13:23:50

解决方案2 10 已采纳 2012-04-13 13:48:57

解决方案3 6

解决方案4 0 2012-04-13 13:28:42

解决方案5 0 2012-04-13 13:28:57

解决方案6 0 2012-04-13 13:31:00

解决方案7 0 2012-04-13 14:40:32

解决方案8 -1 2012-04-13 13:25:35

解决方案1
12 2012-04-13 13:23:50

解决方案2
10 已采纳 2012-04-13 13:48:57

解决方案3
6

解决方案4
0 2012-04-13 13:28:42

解决方案5
0 2012-04-13 13:28:57

解决方案6
0 2012-04-13 13:31:00

解决方案7
0 2012-04-13 14:40:32

解决方案8
-1 2012-04-13 13:25:35