cost 386 ms
netlib scalapack example1.f - 執行問題

[英]netlib scalapack example1.f - execution problems

我正在嘗試編譯、鏈接和運行 netlib 的 scalapack example1.f 程序。 example1.f 的代碼 代碼編譯並鏈接正常,但執行時顯示結果不穩定。 有時殘差非常低。 其他時候大約是 10E+13。 我還看到,在執行 example1 和其他一些 scalapack 測 ...

覆蓋 PILAENV

[英]Overwriting PILAENV

不幸的是,英特爾出於某種原因決定將其 ScaLAPACK 實現的 PILAENV 的返回值(推薦的塊大小)設置為 512。該值提供的性能不理想(在英特爾自己的 CPU 上。)我很困惑他們為什么這樣做,有沒有辦法覆蓋這個值。 例如? 通過環境變量? ...

編譯時如何鏈接庫 scalapack 和 blacs

[英]How to link library scalapack and blacs while compilation

編譯 fortran 代碼時,我設置 但是在編譯代碼時,它總是鏈接到libmkl_scalapack_lp64.so ,而不是libmkl_scalapack_lp64.a 。 然后出現錯誤, 鏈接這兩個庫的正確方法是什么? ...

用於分配陣列的阻塞因子是什么?

[英]What is the blocking factor used to distribute the array?

在descinit示例的文檔中,我們在分布式數組的描述符中找到以下屬性(參數 4 和 5): 這里描述的阻塞因子是什么? ...

2021-06-02 07:35:19   1   59    scalapack  
在進程之間平衡一組不同大小的矩陣塊的算法

[英]Algorithm to balance a set of differently sized matrix blocks between processes

我想在進程之間平衡一組矩陣塊。 矩陣塊具有不同的大小,盡管通常一個單獨的塊占主導地位,具有相似的大小或什至大於所有其他塊的組合。 進程的數量可能比塊的數量大得多和小得多。 每個塊可以存儲在單個進程中,也可以作為 ScaLAPACK 陣列分布。 平衡應在質量上滿足以下條件: 沒有進程應該接收比 tar ...

在 SCALAPACK 中找到分布式向量范數的有效方法

[英]Efficient way to find norm of distributed vector in SCALAPACK

使用 scalapack 考慮以下代碼: 它是我嘗試的迭代求解器的一部分,問題是如果我的處理器網格是二維的,我的向量在這些 procs 上沒有任何元素,因此 dnrm2 產生零或norm變量。 因此導致一些proc從循環中提前退出,掛起整個循環。 除了手動廣播等之外,確保正確分配規范值的正確方法是什 ...

scalapack中的行分配不一致

[英]Inconsistent rows allocation in scalapack

考慮以下簡單的 fortran 程序 當我以 11 mpi 等級運行它時,我得到 這就是我希望 scalapack 划分這個數組的方式,但是,對於我得到的偶數等級: 這沒有任何意義,為什么排名 0 會為塊大小 100 和排名 * 塊大小 > N 獲得 200 個元素。因此,我的程序適用於 mp ...

'MPI_Barrier' 和 'BLACS_Barrier' 都不會停止處理器執行其命令

[英]Niether 'MPI_Barrier' nor 'BLACS_Barrier' doesn't stop a processors executing its commands

我正在研究 ScaLAPACK 並嘗試習慣使用 ScaLAPACK 必不可少的 BLACS 例程。 我上過一些關於 MPI 的初級課程,所以對 MPI_COMM_WORLD 的東西有一些粗略的了解,但對它內部的工作原理等沒有深入的了解。 無論如何,我正在嘗試使用 BLACS 例程按照代碼打招呼。 而 ...

ScaLAPACK 子程序是否在 MPI 行話中“阻塞”?

[英]Are ScaLAPACK subroutines 'blocking' in MPI lingo?

我覺得這是一個愚蠢的問題,但我真的不知道如何用谷歌搜索這個,因為“ScaLAPACK”和“塊”這兩個詞的每一個組合都會用關於 ScaLAPACK 使用的塊循環矩陣分布的信息來轟炸你。 但是,我想知道的是 ScaLAPACK 子例程在 MPI 術語中通常是“阻塞”還是“非阻塞”,即它們是否在返回之前等 ...

無法使用英特爾 MKL ScaLapack 和 Blacs 編譯 package

[英]Can't compile package with intel MKL ScaLapack and Blacs

我正在嘗試編譯包含mkl scalapack和blacs庫的 python package https://github.com/jrs65/scalapy 。 編譯成功但是當我嘗試執行測試程序時,我得到: 英特爾 MKL 致命錯誤:無法加載符號 MKLMPI_Get_wrappers 我嘗試使用 ...

編譯 ScaLapack 的第一個示例

[英]Compile the first example of ScaLapack

我正在嘗試編譯 ScaLapack 的第一個示例。 為此,我正在使用 makefile 進行編譯,並且收到以下錯誤消息: 我已經完成了安裝 ScaLapack 的所有步驟,但我認為我必須在 Makefile 中進行一些修改才能編譯示例。 要使用 makefile 編譯程序,只需在終端上鍵入“mak ...

使用 MPI_Type_create_subarray 做二維循環分布的例子

[英]Example of using MPI_Type_create_subarray to do 2d cyclic distribution

我想有一個例子來展示如何使用MPI_Type_create_subarray為大矩陣構建二維循環分布。 我知道MPI_Type_create_darray會給我 2D 循環分布,但它與SCALAPACK進程網格不兼容。 我會使用MPI_Type_create_subarray做 2d 塊循環分布 ...

“ ld:找不到用於-lblacsF77init的庫”

[英]“ld: library not found for -lblacsF77init”

我試圖在Macbook上使用mpi編譯我的代碼,但出現以下錯誤:“ ld:-lblacsF77init未找到庫”。 我不知道在哪里可以找到該庫以及如何創建正確的路徑。 這是makefile:#串行Fortran編譯器程序 非常感謝您提供的任何幫助。 ...

Blac:不使用所有MPI內核的處理器網格

[英]Blacs: processor grids that do not use all MPI cores

當處理器網格未使用所有可用的MPI內核時,Scalapack出現問題。 說我知道要設置Pc*Pr<=NP的網格 當我設置過程網格時 Cblacs_gridinfo將輸入網格大小從2 x 2更改為-1 x -1 。 在這種情況下,我正在使用11 MPI內核進行測試。 ...

python ctypes用示例gsl gslcblas鏈接多個共享庫

[英]python ctypes link multiple shared library with example gsl gslcblas

我想使用python共享庫中的某些功能。 從python文檔中,我知道ctypes是一個不錯的選擇。 但是,這樣的庫有一些未定義的符號,我應該將其鏈接到另一個共享庫以獲取這些符號。 在g ++中,它很簡單:g ++ main.cpp -la -lb。 我需要的功能在liba.so中, ...

Scalapack返回錯誤答案

[英]Scalapack returns wrong answer

我正在嘗試編寫一些C代碼,以使用scalapack中的pzheevd例程查找大型矩陣的所有特征值。 我有以下簡單的示例,其中已對一個簡單的4x4矩陣進行了硬編碼。 使用單個過程,2個過程或4個過程,我可以獲得正確的特征值(-2.0396,-2,2,2.0396)。 但是,即使看起來所有矩陣 ...

在Fortran中使用SCALAPACK的分段錯誤? 沒有回溯?

[英]Segmentation fault using SCALAPACK in Fortran? No backtrace?

我正在嘗試在Fortran中使用SCALAPACK和MPI查找Hermitian矩陣的特征值和特征向量。 對於壓錯程序,我使該程序盡可能簡單,但仍然遇到分段錯誤。 根據給有類似問題的人的答案,我嘗試將所有整數更改為integer * 8,並將所有實數更改為real * 8或real * 16 ...

修復分布式版本中的算術錯誤

[英]Fix arithmetic error in distributed version

我正在分布式環境中通過 Cholesky 分解來反轉矩陣,正如這里討論的那樣。 我的代碼工作正常,但為了測試我的分布式項目是否產生正確的結果,我不得不將它與串行版本進行比較。 結果並不完全一樣! 例如,結果矩陣的最后五個單元格是: 我曾在英特爾論壇上發布過關於此的帖子,但我得到的答案是在我將使 ...

ScaLAPACK中大小不同的塊?

[英]Blocks of different sizes in ScaLAPACK?

我正在使用ScaLAPACK的Intel-MKL執行Cholesky分解。 基於此示例 ,我分配了矩陣,其中矩陣按大小相等(即Nb x Mb)的塊分布。 我試圖做到這一點,以便每個塊都有它自己的大小,這取決於它屬於哪個進程,以便我可以進行更多的實驗,也許可以獲得更好的性能。 請檢查此問 ...

Cholesky 與 ScaLAPACK

[英]Cholesky with ScaLAPACK

我正在嘗試通過使用 ScaLAPACK 的 MKL-Intel 庫的pdpotrf()進行 Cholesky 分解。 我正在讀取主節點中的整個矩陣,然后像在這個例子中一樣分發它。 當 SPD 矩陣的維數為偶數時,一切正常。 但是,當它奇怪時, pdpotrf()認為矩陣不是正定的。 難道是因為子矩 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM