[英]Sparse Matrix Vs Dense Matrix Multiplication C++ Tensorflow
我想寫在 C++ Tensorflow 稀疏矩陣密集向量(SPMv)乘法:y = Ax
稀疏矩陣 A 以 CSR 格式存儲。 A 的通常稀疏度在 50-90% 之間。 目標是達到比密集矩陣密集向量 (DMv) 乘法更好或相似的時間。
請注意,我已經查看了以下帖子: Q1 Q2 Q3 。 但是,我仍然想知道以下幾點:
這個問題與我在這里的另一個問題有關:( CSCC:深度神經網絡的卷積拆分壓縮計算算法)
要回答已編輯的問題:
除了矩陣格式本身之外,甚至矩陣中條目的順序也會對性能產生巨大影響,這就是為什么 Cuthill-McKee 算法經常用於減少矩陣帶寬(從而提高緩存性能)的原因。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.