[英]Recommend a fast sorting algorithm for local order among the segment in the array
在GPU上的数组中的每个分段中对数据进行排序,分段的大小为32,并且对于不同的分段没有进一步的排序或合并。 因此,我将每个段的数据从全局内存加载到共享内存中,并在完成每个段的排序后将数据存储到全局内存中。 为了获得更高的吞吐量,什么是并行算法?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.