帶有私有和共享子句的C ++ OpenMP計算錯誤

Question

我有一個與OpenMP並行化的for循環，但是有多個計算錯誤，可能是由於我對OpenMP多線程概念的了解不足：

for ( int i = -X/2; i < X/2; ++i )
{
    base.y = anchor + i*rho_step;
    temp = some_function( base );
    if( temp > response )
    {
        buffer.y = base.y;
        response = temp;
    }
}

這工作正常，然后進行了以下更改：

#pragma omp parallel for shared (buffer, response) private(base, temp)
for ( int i = -X/2; i < X/2; ++i )
{
    base.y = anchor + i*rho_step;
    temp = some_function( base );
    if( temp > response )
    {
        buffer.y = base.y;
        response = temp;
    }
}

在此代碼中， buffer.y和response都不具有正確的值。 以我的理解，每個線程都應該有一個自己的base.y和temp副本，它們只是用於計算的臨時變量，並且必須共享buffer和response （它們將存儲計算出的數據），但這不能作為我希望。

唯一理想的版本是以下版本，但顯然並沒有提高性能：

omp_lock_t writelock;
omp_init_lock(&writelock);
omp_set_num_threads (4);

#pragma omp parallel for
for ( int i = -X/2; i < X/2; ++i )
{
    omp_set_lock(&writelock);
    base.y = anchor + i*rho_step;
    temp = some_function( base );
    if( temp > response )
    {
        buffer.y = base.y;
        response = temp;
    }
    omp_unset_lock(&writelock);
}
omp_destroy_lock(&writelock);

可能是什么問題？ （ anchor和rho_step在此循環中是常量）

Answer 1

為了使您的代碼能夠處理buffer和response變量的跨線程，您需要為它們使用一些每個線程的局部變量，並對它們進行最后的歸約以更新其共享的對應變量。

這是它的外觀（未經測試）：

#pragma omp parallel firstprivate( base )
{
    auto localResponse = response;
    auto localBuffer = buffer;
    #pragma omp for
    for ( int i = -X/2; i < X/2; ++i )
    {
        base.y = anchor + i * rho_step;
        auto temp = some_function( base );
        if ( temp > localResponse )
        {
            localBuffer.y = base.y;
            localResponse = temp;
        }
    }
    #pragma omp critical
    {
        if ( localResponse > response )
        {
            buffer.y = localBuffer.y;
            response = localResponse;
        }
    }
}

帶有私有和共享子句的C ++ OpenMP計算錯誤

問題描述

1 個解決方案

解決方案1
2 已采納 2017-08-22 11:50:08

帶有私有和共享子句的C ++ OpenMP計算錯誤

問題描述

1 個解決方案

解決方案1 2 已采納 2017-08-22 11:50:08

解決方案1
2 已采納 2017-08-22 11:50:08