繁体   English   中英

矩阵乘法的高效实现 ARM cortex A9 - Xilinx SDK

[英]Efficient implementation of matrix multiplication ARM cortex A9 - Xilinx SDK

是否有任何简单的方法库可以使用Xilinx SDK在 ARM CortexA9 双核上实现高效(最大可能速度)线性代数?

我正在使用带有双核 Arm 处理器的 zybo z7 开发板,我想在 Xilinx SDK 上实现一个简单的神经网络,一个卷积层后跟一个密集层。 具体来说,要在 Z551C5C03A1A91F2CF90E0D9AB9 上传输基于 model 的 python numpy。 我阅读了 ARM 和 SIMD 库的一些手册,但我不想深入研究。

对我来说,一个简单的方法是使用库并自己(快速)进行乘法/点积/卷积等,例如 python 中的 numpy 并避免纯 for...loop 语法。 一个例子会很好!

感谢您的时间

您可以尝试使用 Tensorflow 使用的Eigen库来实现矩阵计算,或者您甚至可以尝试使用已经在 ARM-Cortex M 系列处理器上测试过的TensorFlow lite

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM