R 中的并行计算（foreach %dopar% 中的 if 语句）

Question

我想通过以 if 语句为条件的组 (i) 更新我的四个变量（Z1、Z2、IVtmp$differror1、IVtmp$differror2）。

foreach(i=unique(IVtmp$scidx)) %dopar% {
  numerator=sum(P1new[IVtmp$scidx==i])+sum(P2new[DATA$scid==i])
  denominator=sum(P1old[IVtmp$scidx==i])+sum(P2old[DATA$scid==i])
  probab=exp(numerator-denominator)

  if (runif(1)<probab){
    Z1[DATA$scid==i]=e1new[DATA$scid==i]
    Z2[DATA$scid==i]=e2new[DATA$scid==i]
    IVtmp$differror1[IVtmp$scidx==i]=differror1new[IVtmp$scidx==i]
    IVtmp$differror2[IVtmp$scidx==i]=differror2new[IVtmp$scidx==i]
    change=change+1
  } else{
    Z1[DATA$scid==i]=e1old[DATA$scid==i]
    Z2[DATA$scid==i]=e2old[DATA$scid==i]
    IVtmp$differror1[IVtmp$scidx==i]=differror1old[IVtmp$scidx==i]
    IVtmp$differror2[IVtmp$scidx==i]=differror2old[IVtmp$scidx==i]
  }
}

但似乎我无法在 foreah 循环内执行 if 语句。 任何人都可以帮忙吗？

谢谢

Answer 1

“if”语句不是问题。 问题是工作人员不能直接更新主服务器上的变量。 worker 只能计算发送给 master 的值，master 必须用这些值更新自己的变量。

我认为并行运行此问题不会获得良好的性能，但您可以尝试以下操作：

library(doSNOW)
nw <- 4  # choose something reasonable for your computer
cl <- makeSOCKcluster(nw)
registerDoSNOW(cl)
iv <- unique(IVtmp$scidx)

probab <-
  foreach(i=iv, .combine='c') %dopar% {
    numerator=sum(P1new[IVtmp$scidx==i])+sum(P2new[DATA$scid==i])
    denominator=sum(P1old[IVtmp$scidx==i])+sum(P2old[DATA$scid==i])
    exp(numerator-denominator)
  }

for (i in iv) {
  if (runif(1)<probab[i]){
    Z1[DATA$scid==i]=e1new[DATA$scid==i]
    Z2[DATA$scid==i]=e2new[DATA$scid==i]
    IVtmp$differror1[IVtmp$scidx==i]=differror1new[IVtmp$scidx==i]
    IVtmp$differror2[IVtmp$scidx==i]=differror2new[IVtmp$scidx==i]
    change=change+1
  } else{
    Z1[DATA$scid==i]=e1old[DATA$scid==i]
    Z2[DATA$scid==i]=e2old[DATA$scid==i]
    IVtmp$differror1[IVtmp$scidx==i]=differror1old[IVtmp$scidx==i]
    IVtmp$differror2[IVtmp$scidx==i]=differror2old[IVtmp$scidx==i]
  }
}

这会并行计算probab ，然后依次更新数据结构。 为此，我将probab转换为向量。

由于计算probab似乎不是很耗时，我认为您对加速的唯一希望是在并行部分使用极端分块：

library(itertools)
probab <-
  foreach(ivchunk=isplitVector(iv, chunks=nw), .combine='c') %dopar% {
    p <- double(length(ivchunk))
    for (i in ivchunk) {
      numerator=sum(P1new[IVtmp$scidx==i])+sum(P2new[DATA$scid==i])
      denominator=sum(P1old[IVtmp$scidx==i])+sum(P2old[DATA$scid==i])
      p[i] <- exp(numerator-denominator)
    }
    p
  }

这使用每个工人一项任务来减少开销。 这是一项重要的技术，但我仍然不确定在这种情况下它是否会为您提供比顺序运行更好的性能。

R 中的并行计算（foreach %dopar% 中的 if 语句）

问题描述

1 个解决方案

解决方案1
1 已采纳 2018-02-23 20:58:57

R 中的并行计算（foreach %dopar% 中的 if 语句）

问题描述

1 个解决方案

解决方案1 1 已采纳 2018-02-23 20:58:57

解决方案1
1 已采纳 2018-02-23 20:58:57