繁体 English 中英

矩阵乘法的高效实现 ARM cortex A9 - Xilinx SDK

[英]Efficient implementation of matrix multiplication ARM cortex A9 - Xilinx SDK

原文 2021-03-09 08:16:48 9 1 c/ arm/ linear-algebra/ xilinx/ zynq

是否有任何简单的方法库可以使用Xilinx SDK在 ARM CortexA9 双核上实现高效（最大可能速度）线性代数？

我正在使用带有双核 Arm 处理器的 zybo z7 开发板，我想在 Xilinx SDK 上实现一个简单的神经网络，一个卷积层后跟一个密集层。 具体来说，要在 Z551C5C03A1A91F2CF90E0D9AB9 上传输基于 model 的 python numpy。 我阅读了 ARM 和 SIMD 库的一些手册，但我不想深入研究。

对我来说，一个简单的方法是使用库并自己（快速）进行乘法/点积/卷积等，例如 python 中的 numpy 并避免纯 for...loop 语法。 一个例子会很好！

感谢您的时间

1 个解决方案

您可以尝试使用 Tensorflow 使用的Eigen库来实现矩阵计算，或者您甚至可以尝试使用已经在 ARM-Cortex M 系列处理器上测试过的TensorFlow lite 。

重新分配覆盖变量（Zynq SoC（Cortex A9）上的Xilinx SDK）

[英]realloc overwrite variable (Xilinx SDK on a Zynq SoC (Cortex A9))

ARM Cortex-M4 C 代码中的高效嵌入式定点 2x2 矩阵乘法

[英]Efficient Embedded Fixed Point 2x2 Matrix Multiplication in ARM Cortex-M4 C code

手臂皮质a9交叉编译奇怪的浮点行为

[英]arm cortex a9 cross compiling strange floating point behaviour

如何在ARM Cortex A9中使用SWI启用IRQ中断？

[英]How to use the SWI in ARM Cortex A9 for enabling the IRQ interrupt?

ARM程序集中的矩阵乘法

[英]matrix multiplication in ARM assembly

在32位处理器（ARM Cortex A9）中使用64位数据时出现问题

[英]Problem using 64 bit data in 32 bit processor (ARM Cortex A9)

高效的微小布尔矩阵乘法

[英]Efficient tiny boolean matrix multiplication

矩阵乘法并行实现（OpenMP）

[英]matrix multiplication Parallelized implementation (OpenMP)

Cortex A9 NEON与VFP使用混淆

[英]Cortex A9 NEON vs VFP usage confusion

arm_math 矩阵乘法硬故障

[英]arm_math matrix multiplication hardfault

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 重新分配覆盖变量（Zynq SoC（Cortex A9）上的Xilinx SDK） ARM Cortex-M4 C 代码中的高效嵌入式定点 2x2 矩阵乘法手臂皮质a9交叉编译奇怪的浮点行为如何在ARM Cortex A9中使用SWI启用IRQ中断？ ARM程序集中的矩阵乘法在32位处理器（ARM Cortex A9）中使用64位数据时出现问题高效的微小布尔矩阵乘法矩阵乘法并行实现（OpenMP） Cortex A9 NEON与VFP使用混淆 arm_math 矩阵乘法硬故障

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM