当迭代器是类成员时,为什么 C++ 中的 for 循环更慢

[英]Why is a for loop slower in C++ when the iterator is a class member

这个问题以前是我自己问的,虽然不是很好。 我已经对其进行了重新措辞和扩展,我希望我已经澄清了几点。 这个问题非常从初学者的角度来看。


该代码将数组的每个元素加 1,然后将每个元素除以 2。 这暂时是任意的,只是更复杂但非常等效的东西的占位符。

作为背景,这阻止了实时应用程序的音频处理。 这就是原因

int N = 44.1e3 * 60;

所以基本上这将处理以 44.1kHz 采样的 1 分钟音频。

内联编写的显式代码比函数代码运行得快得多。 虽然已经声明了计时器,但它不是一个小差异,而是一个方法在 1 秒内运行而另一个需要大约 8 秒 (ymmv) 的问题。

函数调用将招致开销的惩罚。 速度可以通过更改优化标志来提高,但距离这两种方法在相似的时间范围内运行还差得很远。


  1. 可以更改函数调用方法,同时仍作为类中的函数保留,以便它以与内联方法相似或完全相同的速度运行。?
  2. 是否有任何可以使用的编译器标志会导致两种方法在相似的时间范围内运行? 如果是这样,它们将如何在 Xcode 中使用,最好是有推荐的资源详细说明用法。

下面的代码很简单,而且在风格上不是很专业。 这是为了减少混乱并希望专注于主要问题。

如果可以对适用于上述问题的类定义进行任何更改,我会全力以赴。 否则,我理解您的不满,但它可能与此处无关。

提供的时钟打印输出不是一个彻底的基准测试工具。 它被包含作为两种方法之间大时间差的基本说明。

#include <iostream>
#include <sys/time.h>

class MyClass
    static const int I = 1000;
    int n, i;
    double foo[I] = {0};

    void myFunction(int N)
        for(n = 0; n < N; n++ )
            for(i = 0; i < I; i++ )
                foo[i]+= 1;
                foo[i]*= .5;

int main()
    int N = 44.1e3 * 60; // number of samples
    // The Explicit Approach
    const int I = 1000;
    double bar[I] = {0};
    std::clock_t startTime = std::clock();
    for(int n = 0; n < N; n++)
        for(int i = 0; i < I; i++)
            bar[i] += 1;
            bar[i] *=.5;
    double duration = ( std::clock() - startTime ) / (double) CLOCKS_PER_SEC;
    std::cout << "Explicit Approach Time (seconds): " << duration << '\n';
    //  The Class Approach
    MyClass testClass;
    startTime = std::clock();
    duration = (std::clock() - startTime) / (double) CLOCKS_PER_SEC;
    std::cout << "Class Approach Time (seconds): " << duration << '\n';
    return 0;


#include <iostream>
#include <chrono>
#include <cmath>

class someClass {
   int n, i;           // internal class loop indeces
   double foo[1000];
   int I = ::std::floor(sizeof(foo)/sizeof(foo[0])); // number of elements in foo
   void someFunction(int);

void someClass::someFunction(int N)
   for(n=N; n--; ) {
      for(i=I; i--; ) {
         foo[i] += 1;
         foo[i] *= .5;

int main()

    // this was initially an audio processing problem
    // Essentially, process a minute of audio

   int N = 44.1e3 * 60;

      /// The Explicit Method
      int n, i;             // loop indeces
      double bar[1000];
      int I = floor(sizeof(bar)/sizeof(bar[0]));

      // START CLOCK
      auto start = ::std::chrono::high_resolution_clock::now();

      // Exactly what is defined in the function 'someFunction' above
      for(n=N;n--; ){
         for(i=I;i--; ){
            bar[i]+= 1;

      // END CLOCK
      auto end = ::std::chrono::high_resolution_clock::now();

      std::chrono::duration<double> duration_secs = end - start;

      std::cout<<"Explicit Method Time (seconds): "<< duration_secs.count() <<'\n';

      //  The Function Method
      someClass testClass;

      // START CLOCK
      auto start = ::std::chrono::high_resolution_clock::now();


      // END CLOCK
      auto end = ::std::chrono::high_resolution_clock::now();

      std::chrono::duration<double> duration_secs = end - start;
      std::cout<<"Member Function Time (seconds): "<< duration_secs.count() <<'\n';

    return 0;


$ /tmp/a.out 
Explicit Method Time (seconds): 3.89e-07
Member Function Time (seconds): 1.46e-07

所以,对我来说,显式方法要慢得多。 尽管他们的时间都还很短,以至于几乎不值得衡量。 两者都在数百纳秒的数量级上。 令人印象深刻的是计时器的高分辨率足以测量它。

那么,下一个问题是,您使用的是哪个编译器? 你是为什么平台编译的?

您的代码仍有很多不理想的地方。 我刚刚清理了包含,使用 C++11 中的::std::chrono进行计时,并为手动内联版本和成员函数版本设置了明确的范围。

我在 gcc 7.2 上用 -O3 编译。 它仍然包含未定义的行为,因为它使用了一个未初始化的数组。 查看代码,gcc 意识到数组甚至从未使用过,也没有生成任何代码。 所以,基本上,背靠背调用now 手动内联版本和成员函数之间的时间差异可以完全归因于基本舍入误差。

所以,答案是,您的代码仍然没有显示您正在谈论的问题,并且您仍然没有提供足够的细节。 :-) 要么,要么答案在于您使用的编译器以及您提供的选项。

