MPI在根进程上收集数组

Question

我是MPI的新手。 我有4个进程：进程1到3填充向量并将其发送到进程0，进程0将向量收集到一个非常长的向量中。 我的代码有效（发布时间太长），但进程0的recv操作很笨拙而且非常慢。

在摘要中，代码执行以下操作：

MPI::Init();
int id = MPI::COMM_WORLD.Get_rank();

if(id>0) {
    double* my_array = new double[n*m]; //n,m are int
    Populate(my_array, id);
    MPI::COMM_WORLD.Send(my_array,n*m,MPI::DOUBLE,0,50);
}

if(id==0) {
    double* all_arrays = new double[3*n*m];
    /* Slow Code Starts Here */
    double startcomm = MPI::Wtime();
    for (int i=1; i<=3; i++) {
    MPI::COMM_WORLD.Recv(&all_arrays[(i-1)*m*n],n*m,MPI::DOUBLE,i,50);
    }
    double endcomm = MPI::Wtime();
    //Process 0 has more operations...
}
MPI::Finalize();

事实证明， endcomm - startcomm占总时间的50％（0.7秒，而程序完成时间为1.5秒）。

有没有更好的方法从进程1-3接收向量并将它们存储在进程0的all_arrays ？

我检查了MPI :: Comm :: Gather，但我不确定如何使用它。 特别是，它是否允许我指定进程1的数组是all_arrays中的第一个数组，进程2的数组是第二个数组，等等？ 谢谢。

编辑：我删除了“慢”循环，而是将以下内容放在“if”块之间：

MPI_Gather(my_array,n*m,MPI_DOUBLE,
    &all_arrays[(id-1)*m*n],n*m,MPI_DOUBLE,0,MPI_COMM_WORLD);

导致同样缓慢的表现。 这是否与根进程在尝试下一个进程之前“等待”每个接收完成的事实有关？ 或者这不是思考它的正确方法吗？

Answer 1

是的， MPI_Gather会做到这一点。 从对ANL页MPI_Gather ：

int MPI_Gather(void *sendbuf, int sendcnt, MPI_Datatype sendtype, 
               void *recvbuf, int recvcnt, MPI_Datatype recvtype, 
               int root, MPI_Comm comm)

在这里， sendbuf是每个进程（ my_array ）上的数组。 recvbuf是接收进程中的长数组（ all_arrays ），短数组被收集到该数组中。 接收进程中的短数组被复制到长数组中的连续位置，因此您无需担心自己执行此操作。 每个进程的数组将在长数组中连续排列。

编辑：

如果接收过程在收集过程中没有提供sendbuf，您可能需要使用MPI_Gatherv （感谢@HristoIliev指出这一点）。

MPI在根进程上收集数组

问题描述

1 个解决方案

解决方案1
5 2012-05-07 23:50:13

MPI在根进程上收集数组

问题描述

1 个解决方案

解决方案1 5 2012-05-07 23:50:13

解决方案1
5 2012-05-07 23:50:13