[英]Using R and Rcpp, how to multiply two matrices that are sparse Matrix::csr/csc format?
以下代碼按預期工作:
矩陣.cpp
// [[Rcpp::depends(RcppEigen)]]
#include <RcppEigen.h>
// [[Rcpp::export]]
SEXP eigenMatTrans(Eigen::MatrixXd A){
Eigen::MatrixXd C = A.transpose();
return Rcpp::wrap(C);
}
// [[Rcpp::export]]
SEXP eigenMatMult(Eigen::MatrixXd A, Eigen::MatrixXd B){
Eigen::MatrixXd C = A * B;
return Rcpp::wrap(C);
}
// [[Rcpp::export]]
SEXP eigenMapMatMult(const Eigen::Map<Eigen::MatrixXd> A, Eigen::Map<Eigen::MatrixXd> B){
Eigen::MatrixXd C = A * B;
return Rcpp::wrap(C);
}
這是使用 C++ eigen class 作為矩陣,參見https://eigen.tuxfamily.org/dox
在 R 中,我可以訪問這些功能。
library(Rcpp);
Rcpp::sourceCpp('matrix.cpp');
A <- matrix(rnorm(10000), 100, 100);
B <- matrix(rnorm(10000), 100, 100);
library(microbenchmark);
microbenchmark(eigenMatTrans(A), t(A), A%*%B, eigenMatMult(A, B), eigenMapMatMult(A, B))
這表明 R 在轉置(轉置)方面表現相當不錯。 乘法與本征有一些優點。
使用 Matrix 庫,我可以將普通矩陣轉換為稀疏矩陣。
示例來自https://cmdlinetips.com/2019/05/introduction-to-sparse-matrices-in-r/
library(Matrix);
data<- rnorm(1e6)
zero_index <- sample(1e6)[1:9e5]
data[zero_index] <- 0
A = matrix(data, ncol=1000)
A.csr = as(A, "dgRMatrix");
B.csr = t(A.csr);
A.csc = as(A, "dgCMatrix");
B.csc = t(A.csc);
因此,如果我想使用 eigen 將 A.csr 乘以 B.csr,如何在 C++ 中做到這一點? 如果不需要,我不想轉換類型。 是 memory 大小的東西。
A.csr %*% B.csr
尚未實現。 A.csc %*% B.csc
正在工作。
我想對不同的選項進行微基准測試,看看矩陣大小如何最有效。 最后,我將有一個大約 1% 稀疏的矩陣,並且有 500 萬行和列...
dgRMatrix 叉積函數尚未實現是有原因的,事實上,它們不應該被實現,否則它們會導致不好的做法。
使用稀疏矩陣時有一些性能注意事項:
可能存在行優先排序大放異彩的應用程序(即參見 Dmitry Selivanov 在 CSR 矩陣和 irlba svd 上的工作),但這絕對不是其中之一,事實上,所以你最好進行就地轉換得到一個 CSC 矩陣。
tl; dr :行主要矩陣中的按列交叉積是低效率的最后通牒。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.