繁体   English   中英

如何使用NEON优化a [i] = b [c [i]]

[英]how to optimize a[i] = b[c[i]] with NEON

我在这里得到了一个非常简单但又大(n大)的循环:

for (i=0; i<n; i++)
{
    dst[i] = src[table[i]];
}

我想使用NEON对其进行优化,但是我不知道如何处理这部分: src[table[i]] 有可能优化吗? 如果是,怎么办?

感谢@Paul R及其评论:

这实际上是收集的负载,NEON不支持。请参阅: stackoverflow.com/questions/11502332/…

由于NEON无法对其进行优化,因此我尝试了OpenMP ,并进行了重大改进。 代码也很简单:

#pragma omp parallel for
for (i=0; i<n; i++)
{
    dst[i] = src[table[i]];
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM