![](/img/trans.png)
[英]Can I get a call graph of C routines which are called via a DPI call from a system verilog testbench
[英]Can CULA routines be called from device kernels?
因此,我试图查看是否可以通过使用GPU通过同时解决一堆问题来解决一些超定方程组,从而获得显着的提速。 我当前的算法涉及使用CULA Dense库中的LU分解函数,该库还必须在GPU和CPU之间来回切换,以初始化和运行CULA函数。 我希望能够从CUDA内核中调用CULA函数,这样我就不必跳回CPU并将数据复制回去。 这也将允许我创建在不同数据集上工作的多个线程,以同时解决多个系统。 我的问题是我可以从设备功能中调用CULA功能吗? 我知道CUBLAS和其他一些CUDA库是可能的。
谢谢!
最简洁的答案是不。 CULA库例程设计为从主机代码而非设备代码调用。
需要注意的是CULA有自己的支持论坛在这里 ,你可能会感兴趣。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.