posix线程和O3优化

Question

我正在使用mpi（openmpi 1.4.3）和pthreads的程序在Linux下的c ++中工作。

一些mpi节点具有使用pthreads实现的排队系统。 想法很简单，一个线程将元素添加到队列中，而其他几个“工作”线程则拾取对象并在其上完成工作（不是火箭科学）。

请考虑我的工作线程中提取元素的2个示例。 除非指定了-O3优化，否则第一个示例工作正常。 在那种情况下，它开始无休止地循环而没有捡起任何东西。

    while (true){
        if (t_exitSignal[tID]){
            dorun = false;
            break;
        }

        //cout<<"w8\n";

        //check if queue has some work for us
        if (!frame_queue->empty()){

            //try to get lock and recheck that queue no empty
            pthread_mutex_lock( &mutex_frame_queue );

            if (!frame_queue->empty()){
                cout<<"Pickup "<<tID<<endl;
                con = frame_queue->front();
                frame_queue->pop();
                t_idling[tID] = false;
                pthread_mutex_unlock( &mutex_frame_queue );
                break;
            }

            pthread_mutex_unlock( &mutex_frame_queue );
        }

    }

现在考虑这段代码，完全一样的代码，除了在检查queue-> empthy之前互斥锁gettimg已锁定。 这项工作适用于所有级别的优化。

    while (true){
        if (t_exitSignal[tID]){
            dorun = false;
            break;
        }
        //cout<<"w8\n";

        //try to get lock and recheck that queue no empty
        pthread_mutex_lock( &mutex_frame_queue );

        //check if queue has some work for us
        if (!frame_queue->empty()){

                cout<<"Pickup "<<tID<<endl;
                con = frame_queue->front();
                frame_queue->pop();
                t_idling[tID] = false;
                pthread_mutex_unlock( &mutex_frame_queue );
                break;

        }
        pthread_mutex_unlock( &mutex_frame_queue );

    }

以防万一，这就是我从其他线程填充队列的方式

                    pthread_mutex_lock( &mutex_frame_queue );
            //adding the same contianer into queue to make it available for threads
            frame_queue->push(*cursor);
            pthread_mutex_unlock( &mutex_frame_queue );

我的问题是：为什么第一个代码示例停止工作，为什么使用-O3选项进行编译？ 关于排队系统还有其他建议吗？

非常感谢！

解决方案：这就是我最后提出的。 似乎比上述两种方法都好得多。 （以防万一有人感兴趣；）

    while (true){

        if (t_exitSignal[tID]){

            dorun = false;
            break;
        }
        //try to get lock and check that queue no empty
        pthread_mutex_lock( &mutex_frame_queue );

        if (!frame_queue->empty()){

            con = frame_queue->front();
            frame_queue->pop();
            t_idling[tID] = false;
            pthread_mutex_unlock( &mutex_frame_queue );
            break;
        }else{

            pthread_cond_wait(&conf_frame_queue, &mutex_frame_queue);
            pthread_mutex_unlock( &mutex_frame_queue );
        }




    }

新增中

        pthread_mutex_lock( &mutex_frame_queue );

        //adding the same contianer into queue to make it available for threads
        frame_queue->push(*cursor);
        //wake up any waiting threads
        pthread_cond_signal(&conf_frame_queue);
        pthread_mutex_unlock( &mutex_frame_queue )

Answer 1

我倾向于在第一次空检查之前建议__sync_synchronize() ，但这可能并不安全-如果在添加到容器的过程中有另一个线程，当您调用empty()时，该容器可能仍处于不一致状态。 根据容器的不同，从找回错误答案到崩溃都可能发生任何事情。

乔希也可能是对的。 锁定互斥锁还提供了内存屏障，这意味着您的代码将重新读取其正在使用的内存，以确定每次容器是否为空。 没有某种类型的内存屏障，实际上并不能保证会发生这种情况，因此在更高的优化级别上，您的代码可能永远看不到更改。

另外，您是否研究过pthread的条件变量？ 它们将使您避免循环轮询直到容器不再为空。

Answer 2

我想您会在检查队列是否为空时看到基于指令排序假设的错误-当您启动优化时，顺序会更改，并且由于您没有设置互斥锁而无法保护内存，该顺序会中断这是发生的。

posix线程和O3优化

问题描述

2 个解决方案

解决方案1
2 2011-07-28 23:30:18

解决方案2
1 已采纳 2011-07-28 23:16:12

posix线程和O3优化

问题描述

2 个解决方案

解决方案1 2 2011-07-28 23:30:18

解决方案2 1 已采纳 2011-07-28 23:16:12

解决方案1
2 2011-07-28 23:30:18

解决方案2
1 已采纳 2011-07-28 23:16:12