[英]Parallelizing std::replace on std::deque
首先,我知道双端队列中的多个写手不是很容易处理。 但是使用以下算法,我可以保证元素上没有并发访问。 该算法在块中划分deque(它非常大,这就是我并行化它的原因)并且std :: replaces替换deque中的值。 问题是,在某些情况下,在替换任意值之后,该值似乎仍然存在(顺便说一下:新值与旧值不同)。 可能是这个值没有从cpu寄存器中同步到内存吗? 这里的代码:
std::deque<int*> _deque;
...
int threadsCount = 25;
int chunkSize = ceil((float) _deque.size() / (float) threadsCount);
std::vector<std::thread> threads;
for (int threadNo = 0; threadNo < threadsCount; threadNo++) {
std::uint64_t beginIndex = threadNo * chunkSize;
std::uint64_t endIndex = (threadNo + 1) * chunkSize;
if (endIndex > _deque.size()) {
endIndex = _deque.size();
}
std::deque<int*>::iterator beginIterator = _deque.begin() + beginIndex;
std::deque<int*>::iterator endIterator = _deque.begin() + endIndex;
threads.push_back(std::thread([beginIterator, endIterator, elementToReplace, elementNew] () {
std::replace(beginIterator, endIterator, elementToReplace, elementNew);
}));
}
for (int threadNo = 0; threadNo < threadsCount; threadNo++) {
threads[threadNo].join();
}
在该算法之后,有时(不确定)的情况是被替换的(elementToReplace)值仍然在deque中。
不要手动实现这样的算法,只需传递适当的执行策略:
std::replace(std::execution::par, deque.begin(), deque.end(), elementToReplace, elementNew);
// ^^^^^^^^^^^^^^^^^^^
// executes the algorithm in parallel
请注意,您必须使用C ++ 17或更高版本进行编译。
它看起来像一个竞争条件,但我无法重现它: http : //cpp.sh/5egzm这可能取决于你正在使用的deque实现,但它看起来很奇怪
仅供参考:由于上述算法崩溃且建议的执行策略在我的系统上仍然不可用,我使用了GNU parallel:
__gnu_parallel::replace(_deque.begin(), _deque.end(), elementToReplace, elementNew);
我会告诉你它是否有效以及性能统计数据。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.