cost 281 ms
Eigen + MKL 對復矩陣使用單核 (ZHEEV)

[英]Eigen + MKL uses single core for complex matrix (ZHEEV)

mkl 在我們的集群上有一個奇怪的行為。 我將 Eigen::SelfAdjointEigenSolverEigen::MatrixXcd 稱為復矩陣 (ZHEEV)。 當我計算大矩陣(dim >~ 100k)的特征向量時,它只使用一個核心。 奇怪的是,對於沒有特征向量的較小的復雜矩陣、實 ...

LAPACK 的 zgesvd 結果不同於 scipy.linalg 的 SVD

[英]LAPACK's zgesvd results different than scipy.linalg's SVD

所以我正在嘗試計算NxN矩陣的 SVD。 奇怪的是,對於2x2矩陣的所有情況,來自 lapack 和 scipy 的 SVD 匹配,但是當 I go 用於3x3或4x4矩陣時它們不同。 產量 和scipy.linalg.SVD產量 到目前為止,一切都很好。 現在當我嘗試輸入一個3x3或NxN矩陣時 ...

如何在 Windows 下使用 cmake 和 MinGW 編譯 C 接口 LAPACKE?

[英]How can I compile the C interface LAPACKE using cmake and MinGW under Windows?

我知道已經發布了 Windows 的二進制文件,我只是想嘗試自己編譯它。 我正確安裝了 CMake、mingw32-make、gcc、gfortran 等。 (使用 MinGW) 我試過了 然后我得到了 Fortran 的 static 庫 liblapack.a 和 libblas.a,但沒有 ...

輸出結果不匹配,LAPACKE_zheev() vs cusolverDnZheevd()

[英]output results mismatch, LAPACKE_zheev() vs cusolverDnZheevd()

我正在將代碼從舊的 cblas/lapacke 轉換為 cudaBLAS/cudaSOLVER 並且遇到了一些問題。 我做了一個測試程序來深入了解這一點。 附上我正在使用的代碼: 可以使用 #define __CUDA 編譯程序以獲得 cuda 構建或不使用 #define __CUDA 獲得非 ...

LAPACKE C++ 實數矩陣求逆

[英]LAPACKE C++ Real Matrix Inversion

我正在嘗試在 C++ LAPACKE 中反轉實矩陣。 我對復雜矩陣具有相同的功能,並且可以正常工作。 但真實案例給出了錯誤的答案。 這是我的功能: 我嘗試反轉一個 24 x 24 的雙精度矩陣。 雖然程序似乎幾乎就在那里,但逆還沒有完全到位,它與 python linalg inverse 給我 ...

LAPACKE C++ 復數矩陣求逆

[英]LAPACKE C++ complex Matrix Inversion

我試圖使用 LAPACKE 包在 C++ 中反轉復雜矩陣。 我的代碼如下: 這給出了一個錯誤: 我試着做: 對於函數中的第一個循環,但它給出: 我究竟做錯了什么? 我有另一個 inv 函數可以很好地處理雙打。 這是我遇到麻煩的復雜類型。 謝謝 ...

LAPACKE_cheev 只返回特征向量的上矩陣

[英]LAPACKE_cheev only returns upper matrix of eigenvectors

我需要使用 LAPACKE 計算復雜厄密矩陣的特征值/特征向量。 我找到了函數 LAPACKE_cheev。 它正確計算特征值。 然而,它只存儲特征向量的上矩陣。 我遵循了以下示例代碼:[ https://software.intel.com/sites/products/documentation ...

為什么在lapacke中復雜變量的虛部不起作用?

[英]why imaginary part of complex variables in lapacke does not work?

我在Windows中使用TDM gcc 64位編譯器 我的標題 我有一個像這樣的簡單代碼 首先,它給我以下錯誤和警告 我將代碼更改如下 該代碼已使用相同的警告進行編譯,但結果是 警告似乎是一個重要錯誤。 ...

2019-07-09 11:21:32   1   36    c++ / lapacke  
使用 MPI_Type_create_subarray 做二維循環分布的例子

[英]Example of using MPI_Type_create_subarray to do 2d cyclic distribution

我想有一個例子來展示如何使用MPI_Type_create_subarray為大矩陣構建二維循環分布。 我知道MPI_Type_create_darray會給我 2D 循環分布,但它與SCALAPACK進程網格不兼容。 我會使用MPI_Type_create_subarray做 2d 塊循環分布 ...

使用BLAS和LAPACKE在C ++中用SVD計算偽逆

[英]Computation of Pseidoinverse with SVD in C++ using BLAS and LAPACKE

我正在嘗試實現矩陣的偽逆計算A *,以解決C ++中具有尺寸的正方形nxn矩陣A的Ax = b的問題。 A *的算術公式是通過SVD分解得出的。 因此,首先我計算SVD(A)= USV ^ T,然后計算A * = VS U ^ T,其中S是反對角線S,其中非零元素si在S *中變為1 / ...

英特爾MKL LAPACKE_dsyevd,n> 32766 - >沒有足夠的內存來分配LAPACKE_dsyevd中的工作數組

[英]Intel MKL LAPACKE_dsyevd with n > 32766 --> Not enough memory to allocate work array in LAPACKE_dsyevd

我想使用來自英特爾MKL(2019 Update 2)的LAPACKE_dsyevd計算實對稱矩陣的所有特征值和所有特征向量。 我在C#中使用以下方法: 同 以及以下測試代碼: 同 如果n大於32766則失敗並顯示以下錯誤消息: 內存不足以在LAP ...

LAPACKE矩陣求逆分段錯誤C

[英]LAPACKE matrix inversion segmentation fault C

我正在嘗試使用 lapacke 庫編寫代碼來反轉 C 中的復雜矩陣。但是我遇到了分段錯誤,這似乎取決於矩陣的大小 N。 更重要的是,每次編譯程序或觸摸任何東西時,發生分段錯誤的大小都會有所不同。 這讓我覺得某處代碼試圖訪問分配不當或禁止的內存。 不幸的是,我不明白這是如何發生的,因為它似乎與 LAP ...

如何與Rcpp一起使用OpenBlas Lapacke

[英]How to use OpenBlas Lapacke together with Rcpp

我必須使用一些運行的C ++代碼Lapacke附帶版本OpenBlas 。 我想將此代碼包含在R包中,並使用Rcpp包在該函數和R之間傳輸數據。 但是兩者似乎不喜歡彼此。 只要在一個源文件中包含#include <lapacke.h>和#include <Rcpp.h&g ...

使用 dpbtrf 時出現分段錯誤

[英]Segmentation fault when using dpbtrf

我嘗試在 C++ 中使用 LAPACK 例程dpbtrf ( Documentaton ),但總是出現分段錯誤。 我不確定如何傳遞矩陣LAPACKE_dpbtrf並嘗試從我發現的幾個示例中復制它但沒有成功。 如何使下面的代碼工作? 我想計算矩陣的 cholesky 分解 這是我嘗試過的: ...

使用Intel MKL計算`trans(a)* inv(b)* a`的正確方法

[英]Proper way to calculate `trans(a)*inv(b)*a` with Intel MKL

我正在使用英特爾的MKL LAPACKE和CBLAS進行計算 yn = trans(a)*inv(zt)*a + trans(b)*inv(zl)*b 其中a和b是m×n的實數矩陣, zt和zl是m×m的復數矩陣。 所得的復數矩陣yn為n×n。 這是我的做法: 實際代 ...

緩存先前對lapacke gelsd的調用的中間結果

[英]Cache intermediate results of prior calls to lapacke gelsd

迭代算法在每次迭代中都使用一列B調用LAPACKE_sgelsd。后續調用通常使用相同的A矩陣。 我認為,如果A矩陣未更改,則性能的實質改進將是緩存或某種方式重用上一次迭代的中間結果。 這應該有點類似於為B傳遞多列時可能獲得的收益。這是正確的嗎? 實施將有多困難?如何完成? 它使用ope ...

CentOS 5中的lapacke.h

[英]lapacke.h in CentOS 5

我正在嘗試創建一個使用BLAS和LAPACK C擴展的Python輪子。 在Ubuntu下編譯這樣的軟件包需要以下系統軟件包: libopenblas-dev :(Open)BLAS開發庫 liblapack-dev :LAPACK開發庫 liblapacke-dev ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM