我试图理解为什么我的 OpenACC 代码在 Nvidia V100 GPU 上的运行速度比在 AMD Mi-250 GPU 上的运行速度快 17036.0939901 倍。这是一个简单的矩阵乘法代码。 这是我在 Nvidia V100 GPU 上获得的 output,耗时 2.2043999284 ...
我试图理解为什么我的 OpenACC 代码在 Nvidia V100 GPU 上的运行速度比在 AMD Mi-250 GPU 上的运行速度快 17036.0939901 倍。这是一个简单的矩阵乘法代码。 这是我在 Nvidia V100 GPU 上获得的 output,耗时 2.2043999284 ...
我正在尝试编译使用直接 I/O 的 C 代码。 有一行使用 O_DIRECT 标志: 英特尔和 GNU 很好地理解了这一点并进行了编译。 Cray 无法通过 O_DIRECT。 它不认为它被设置在任何地方。 Cray 编译器是否有这个变量的替代方案? 或者它可以不做直接 I/O 吗? ...
我需要在aprun下的 Cray 系统上运行 MPI 代码。 出于我不会 go 的原因,我被要求运行它使得没有节点具有超过一个进程。 我一直对aprun手册页感到困惑,我不确定我是否已经弄明白了。 如果我只有两个进程,这个命令会确保它们在不同的节点上运行吗? (假设一个节点上有 32 个核心。)& ...
我正在尝试用crayftn编译代码。 我收到一条错误消息 所以它想要标志--no-relax ? 好的,我可以做到。 所以我重新链接到那个标志,然后它告诉我 所以它要求“ --no-relax ”,但它不理解它。 有人知道解决这个难题的方法吗? 还是首先解决根本问题的另一种方法? ...
我正在开发一个 Cray 系统,该系统需要在找到动态库之前传递“-dynamic”。 就我而言,我正在尝试与 libtiff 链接。 命令cc main.cpp -ltiff失败,找不到文件,但cc main.cpp -dynamic -ltiff有效。 我相信这个 file not found ...
我正在尝试在 craycc 下编译 C 代码。 编译失败并出现错误“relocation truncated to fit: R_X86_64_32”。 在 Intel 或 GNU 下,我可以使用“mcmodel”标志克服这个错误。 但是 craycc 不识别这个标志。 有谁知道 craycc 下的 ...
我正在尝试使用Cray编译器编译Fortran代码。 我在代码中有一个标准的预处理ifdef块: 克雷根本不喜欢这样。 告诉我 有谁知道我怎样才能使Cray编译器满意? (此代码BTW使用intel和gcc可以正常编译。) ...
我刚刚在 test 目录下创建了一个三行 CMakeLists.txt 如下,它下面没有文件。 我尝试了导出 lib 路径等,但基本技巧都没有奏效。 如何使这项工作? 并运行它并得到以下错误。 如何在 cray 包装器上使用 blas 制作 find_package 所需的工作? ...
假设我有一个主程序,它基本上是一个等级为1的mpi,它使用MPI生成以生成5个辅助程序。 现在,如果我使用以下命令执行主服务器 生成后的等级总数为6。但是,这6个等级是否都将在同一节点上运行? 无论如何,我可以在3个节点之间分配6个吗? 我可以精确复制一份主流程和5个工作流 ...
我需要在要在Cray机器上编译的项目中使用libxml2。 原则上,它已安装,有一个xml2-config程序为我提供了链接器标志: 我有一个非常简单的测试程序: 虽然原则上不需要,但是我可以使用gcc test.c -lxml2 -L/lib64 -lz -llzma -lm ...
我目前正在Cray设置的HPC系统上编译代码。 要调用Fortran,C和C ++编译器,建议使用Cray提供的ftn , cc和CC编译器包装。 现在,我想知道ftn包装器在实际的编译器调用中添加了哪些选项(在我的情况下为ifort ,但这无关紧要)。 通过使用MPI包装器,我知道- ...
我正在Cray上建造NWChem。 libtcmalloc_minimal已经由我的Cray环境中的cc添加到存档文件中。 在我的配置例程中,它显式地附加了第二个-ltcmalloc_minimal,导致多个定义并且配置失败。 但没有配置的。*文件或者makefile(或任何文件包含NWC ...
我正在使用cray-mpich / 7.4.0。 当我做 它打印4而不是8.为什么? 集群机器肯定是64位。 我在另一个集群上用openmpi / 1.10.2尝试了这个,打印出8。 ...
错误信息: 模块mMatrices(在mod_matrices.f08中)调用子模块smAllocations(在mod_sub_matrices_allocators.f08中)中的函数allocator_rank_2_sub 。 代码在将模块mMatrices分解为模块和子模块之前 ...
我试图用Cray Fortran编译器编译OpenACC Fortan代码... 失败并显示错误消息 因此,显然我必须指定目标加速器。 问题是,在Bing搜索中,尤其是在crayftn手册页中,我找不到任何有关如何执行此操作的文档。 有人知道使用什么标志吗? 顺便说一句 ...
我正在根据http://docs.h5py.org/en/latest/build.html上的教程安装h5py。安装成功。 但是,测试失败, 我懂了: 看起来cython找不到共享库,我该如何附加呢? 谢谢。 ...
我有一个用fortran90编写的程序,该程序将数组写入文件,但是由于某种原因使用星号表示多列: 稍后从文件读取时,我遇到了I / O错误: lib-4190:无法恢复的库错误 数字输入字段包含无效字符。 在从单元10进行列表定向的READ期间遇到的问题Fort ...
我正在编译一个代码,该代码使用Cray XC30系统上的BLAS和LAPACK的Cray LibSci数值库,使用带有“ -ipo”标志并包括“ -openmp”的Intel编译器来编译支持OpenMP的代码。 对于我尝试编译的任何代码,我都会看到以下错误: 这可以用一个非常简单的 ...
我想在Cray XC MPP机器上编译最新版本的VASP 5(5.4.1)。 有人有我可以使用的设置吗? VASP发行版不附带Cray的示例。 构建系统已从5.3.5版本更改。 ...
我需要在Cray XC MPP机器上编译VASP 5.3.5。 该系统具有可用的Gnu,Intel和Cray编译环境。 对于BLAS,LAPACK和ScaLAPCK,也可以选择Intel MKL或Cray LibSci。 哪个是使用的最佳编译器,哪个是最佳的数字库,哪个是Makefil ...