[英]pthread_join is being a bottleneck
我有一个应用程序,其中pthread_join
是瓶颈。 我需要帮助来解决这个问题。
void *calc_corr(void *t) {
begin = clock();
// do work
end = clock();
duration = (double) (1000*((double)end - (double)begin)/CLOCKS_PER_SEC);
cout << "Time is "<<duration<<"\t"<<h<<endl;
pthread_exit(NULL);
}
int main() {
start_t = clock();
for (ii=0; ii<16; ii++)
pthread_create(&threads.p[ii], NULL, &calc_corr, (void *)ii);
for (i=0; i<16; i++)
pthread_join(threads.p[15-i], NULL);
stop_t = clock();
duration2 = (double) (1000*((double)stop_t - (double)start_t)/CLOCKS_PER_SEC);
cout << "\n Time is "<<duration2<<"\t"<<endl;
return 0;
}
螺纹功能中打印的时间范围为40ms - 60ms ,主要功能中打印的时间为650ms - 670ms 。 具有讽刺意味的是,我的串行代码运行时间为650毫秒 - 670毫秒 。 我该怎么做才能减少pthread_join
所花费的时间?
提前致谢!
在Linux上, clock()
测量组合的CPU时间。 它不测量墙壁时间。
这就解释了为什么你得到~640 ms = 16 * 40ms
。 (正如评论中所指出)
要测量墙壁时间,您应该使用以下内容:
通过创建一些线程,您将为系统增加开销:创建时间,调度时间。 创建线程需要分配堆栈等; 调度意味着更多上下文切换 此外, pthread_join suspends execution of the calling thread until the target thread terminates
。 这意味着您希望线程1完成,当他完成时,您可以尽快重新安排,但不能立即重新安排,然后等待线程2等等...
现在你的计算机有几个内核,比如一个或两个,你创建了16个线程。 最多程序的2个线程将同时运行,只需添加时钟测量值就可以得到大约400 ms
。
这又取决于很多事情,所以我很快就会发生什么事情。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.