[英]Why does CuBlas not use a 1d array for triangular matrices?
這可能是對舊的BLAS庫設計的一種回想,但我剛才感到驚訝的是,發現CuBlas通過對三角形矩陣使用常規2d數組來浪費內存。 我想這使與API其余部分的接口更加方便。
剛才我很驚訝地發現CuBlas通過對三角形矩陣使用常規2d數組浪費了內存
嚴格說來並非如此。
如果您查看2級BLAS例程,您會發現它們在以打包格式存儲的三角或Hermitian矩陣上運行。
3級BLAS例程沒有,但是有兩個很好的理由將它們以完全密集的格式存儲。
BLAS就是這樣
這些例程大部分已添加到BLAS中,以支持LAPACK求解器。 而且這些求解器通常在提供的全密集輸入中原位存儲分解的結果,因此在BLAS中使用該格式是合乎邏輯的
我想如果您不喜歡這種設計選擇,可以隨時嘗試寫信給Jack Dongarra投訴。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.