cost 27 ms
强缩放中的串行时间参考

我实现了两种算法,每种算法都执行矩阵矩阵乘法。 第一个是使用 OpenMP 的纯共享 memory,第二个是分布式 memory,它采用混合 MPI/OpenMP 方法。 我有兴趣分析我的分布式 memory 算法的扩展性能。 为此,我将考虑两种应用:缩短解决时间(强扩展),解决更大的问题(弱扩展) ...

2022-08-09 08:49:31 0 16
如何在python中编写程序并行运行5000个函数?

我有一个时间序列数据,我已经在其上训练了 5000 个不同的回归器(模型)。 每个 model 需要预测 100 个不同的类别,每个类别 30 个不同的子类别,200 个值。 IE 时间预测方法运行的总数为 5000 x 100 x 30 = 15,000,000 我有一个想法,这可以使用并行处 ...

2022-08-08 17:04:38 1 28
调用 API 20 次以生成列表,最佳实践?

案例是我调用一次 API 来获取租户列表,然后对于每个租户,我必须再次调用以获取租户的使用列表。 不幸的是,没有办法在一次通话中获得所有租户的使用情况。 现在我希望通过同时进行这些调用来节省时间。 然后在最后一个到达后将它们放在一起。 到目前为止,这是我的尝试: 代码运行并执行它应该做的事情,但我 ...

2022-08-08 11:24:17 2 76
如何使用 GPU/MATLAB 加速自定义 function?

假设我有一个 function f(x) ,st yi=f(xi) 现在给定一个array=(x1,x2,……,xn),我们要计算z = f(array),如何使用GPU加速计算? 即代码没有体现gpu的并行加速能力 如果我按如下方式更改代码,它会变得更快。 那么,如果我的算法的基本逻辑如下,如何 ...

2022-08-08 08:52:08 1 20
如何动态地将工作分配给线程

我正在尝试编写代码来查找成对和是否偶数(在从 0 到 100000 的所有可能对中)。 我使用 pthreads 编写了代码,其中工作分配是静态完成的。 这是代码 现在我想动态地做工作分配部分。 具体来说,假设我有 5 个线程。 最初我给线程一个特定的范围来使用,假设thread1适用于0-1249 ...

2022-08-08 04:59:22 1 35
在没有 parfor 循环的情况下运行 matlab 的多个实例

我想在不运行 parfor 循环的情况下运行 matlab 的几个实例。 我的代码结构如下: 是否有一种有效的方法可以打开 10 个 matlab 实例,其中每个实例将针对给定的k值运行? 我知道在带有 slurm 的集群中,我可以使用 slurm arrays,即我可以将其添加到 matlab 代 ...

2022-08-07 16:53:34 0 15
python中的批处理

我正在使用 python concurrent.futures 对文件进行批处理,这些文件对普通文件执行读写操作。 某些文件的批处理失败,因为它无法打开通用文件进行操作。 有什么方法可以在 2 个并行进程之间引入延迟 ...

2022-08-06 17:37:26 0 10
OpenMP:在while循环中并行for循环时的奇怪行为

我正在使用 OpenMP 来优化 while 循环内的内部 for 循环。 整个代码很复杂,所以我不能发布这个。 但主要结构是这样的: 问题是当我将#pragma omp parallel for应用于第一个内循环(如下所示)时,第二个运行速度太慢了。 我毫不怀疑代码的 output 和第一个内循环 ...

2022-08-06 12:09:31 0 25
如何使用 aiotthp 读取 netcdf

我是使用 Asyncio 和 aiohttp 的新手: 我正在尝试使用 aiohttp 从物理科学实验室 API 获取数据。 我想获取更大的区域和多年。 因此,为了加快进程,我选择使用 Asyncio。 获取文件后,我无法读取文件。 见下面的代码: 错误: 列表索引必须是整数或切片,而不是 str ...

2022-08-05 18:14:07 0 12
如何降低DPC++中parallel_for的时间成本?

我在 DPC++ 中编写了以下代码来测试时间消耗。 它花费了大约0.6s。 当用一个parallel_for 测试一个队列时,它花费了大约0.15s。 测试时发生了一件更连贯的事情 当复制的数组较小时,此命令几乎不消耗时间。 如何在run()中优化上述代码? 很感谢! ...

2022-08-05 18:11:00 0 17
使用并行 mcmapply 或 mclapply 与现有 function

我正在尝试将 tokenizers::tokenize_sentences function 应用于很长的字符列表。 一个简短的例子如下: 由于我想并行化的长度。 问题是并行似乎只有自定义函数的示例。 我试图将 tokenize_sentences 定义为自定义 function 以使用 mcla ...

2022-08-05 15:39:33 0 13
平行向量填充

我正在尝试在 Rust 中编写 3d 渲染器的基础知识,但我在并行化绘制方法时遇到了问题: 我正在尝试并行填充像素向量,但 Rust 的借用不允许我这样做: 不能分配给*pixels[_] ,因为Fn闭包不能改变它们捕获的变量我正在使用 Rayon 进行并行处理。 ...

2022-08-05 14:06:12 0 38
Python 使用 Function 和 for 循环进行多处理

我是多处理主题的新手,我不确定如何将它用于我的任务。 我创建了一个 function 来预测未来值,现在想使用多处理来一次计算更多预测。 这些函数采用变量“id”(数据帧中的唯一值)和特定的“数据帧”。这个 function 的结果是一个 dataframe,其中包含预测值。 我的第一种方法是: 不 ...

2022-08-05 10:43:26 0 18
并行循环 3D 阵列。

我有一个具有任意 X、Y 和 Z 长度的 3D 数组我想在 parallel.for 循环中对其进行迭代,它不能在不浪费任务的情况下嵌套 afaik 相反,单个循环的长度是 ArrayLengthX * ArrayLengthY * ArrayLengthZ 我可以从当前迭代 + 数组的 X、Y ...

2022-08-05 10:18:04 1 14
OpenMp 程序查找最小和最大元素的出现。 应该在不同的部分完成并打印两个部分所花费的时间[关闭]

关闭。 这个问题需要更加集中。 它目前不接受答案。 想改进这个问题? 更新问题,使其仅通过编辑此帖子专注于一个问题。 1 小时前关闭。 改进这个问题开发一个 OpenMP 程序来查找随机生成的列表中最小和最大元素的出现。 这些操作必须在不同的部分执行,并打印两个部分所花费的时间。 ...

2022-08-05 06:31:04 0 11

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM