cost 393 ms
重擊幫助。 模塊加載功能不起作用

[英]Bash help. module load function not working

我在這里要瘋了,請幫助我。 我有一個批處理腳本,我最終想通過 condor_submit 在集群上執行。 該腳本需要通過“module load matlab/R2020a”加載一些模塊。 但是沒有任何效果。 該腳本如下所示: 當我從我的家庭 shell 運行它時,它給了我: 這兩者都不正確。 在我 ...

錯誤“作業 14.0 的影子 pid 3161 以狀態 4 退出”(禿鷹作業未運行..)

[英]error "Shadow pid 3161 for job 14.0 exited with status 4" (condor jobs are not running..)

我在禿鷹集群上運行工作,它的顯示錯誤.. “作業 14.0 的影子 pid 3161 以狀態 4 退出” #condor_q -分析 14 最后一次成功的比賽:2022 年 7 月 18 日星期一 12:40:34 014.000:忽略用戶優先級運行分析摘要。 在 192 台機器中, ...

2022-07-18 07:17:32   1   13    condor  
HTCondor - 可分區插槽不起作用

[英]HTCondor - Partitionable slot not working

我正在按照 HTCondor 網站中關於高吞吐量計算中心和配置簡介的教程來設置一個可分區插槽。 在我運行任何配置之前 並得到以下輸出。 我通過在文件末尾添加以下行來更新/etc/condor/config.d中的文件00-minicondor 。 並重新配置 現在有了 我按預期得到 ...

我可以在 HTcondor 腳本中混合 bash 腳本嗎?

[英]Can I mix bash script in HTcondor script?

我正在向禿鷹提交一份工作。 傳遞給可執行文件的參數是 bash 腳本生成的數值。 是否可以以這種方式混合 condor 和 bash 腳本? ...

2022-07-11 10:15:58   1   16    condor  
使用 python 在 HTCondor 上提交並行作業

[英]Submitting parallel jobs on HTCondor, using python

我正在嘗試在 HTCondor 上循環提交並行作業,以下是 python 腳本的一個簡單示例 - 我想通過 for 循環(即 10 個作業)同時將每個作業( results )提交給 10 台機器,然后將所有結果合並到一個 pickle 中。 我有這個工作的提交腳本如下 - 我想知道如何提交 10 ...

Condor 主節點和工人只能看到主節點

[英]Condor master node and workers only see the master node

我正在嘗試設置 HTCondor 批處理系統,但是當我執行condor_status ,它只在主節點和工作節點中顯示主節點。 他們都展示了這一點: 主節點上的Condor_restart工作正常,但在工作節點上產生此錯誤: 以下是配置文件: 主節點: 工作節點: 我允許在同一個安全 ...

[HTCONDOR][kube.netes / k8s]:無法在 k8s 內啟動 minicondor 圖像 - condor_master 不工作

[英][HTCONDOR][kubernetes / k8s] : Unable to start minicondor image within k8s - condor_master not working

后期編輯問題是由於: PSP ( Pod security policy )默認情況下不允許我的condor用戶升級。 這就是它不起作用的原因。 因為supervisord以root用戶身份運行並嘗試寫入日志並以root而不是其他用戶(即condor )啟動 condor 收集器描述 mini-c ...

Condor 成功運行 python,但不顯示輸出文件

[英]Condor running python successfully, but doesn't show output files

我是 HTCondor 的新手,我正在嘗試在 condor 系統上運行 python 腳本。 我想在我的代碼中使用 cv2 和 numpy,同時能夠在完成后讀取我的打印和腌制數據。 當前代碼運行並完成(日志文件:返回值 0)。 但是condor_bin.out在我的打印件應該出現的condor_b ...

使用 condor 時如何從環境變量中獲取交互式作業的作業 ID?

[英]How does one get the job ID of an interactive job from an environment variable when using condor?

我通常通過以下方式獲得工作 ID: 但如果它是一項交互式工作,我看不到它的設置。 有沒有辦法設置它? 當我獲得資源時,我看到我的工作有一個工作 ID。 有沒有辦法得到它? 這是應該的 ...

2021-03-25 22:45:12   1   26    hpc / condor  
使當前文件和帶有 condor 的擴展名匹配 output 和錯誤文件? (讓 PBS 和 Slurm 具有相同的 output 文件)

[英]Make current file & the extension with condor match output & error files? (to have PBS and Slurm have same output files)

如何使禿鷹命名我的文件如下: meta_learning_experiments_submission.py.e451863 meta_learning_experiments_submission.py.o444375 我試過了,但它似乎不起作用。 例如,當我執行qsub時它匹配 PBS 的默 ...

Gahp 服務器(故障問題)以狀態 1 意外退出

[英]Gahp server (failure issues ) exited with status 1 unexpectedly

我正在開發一個基於 Web 的工具(名為 cloudcopasi),它從用戶那里獲取工作並將其提交給 bosco 資源(計算節點)。 我在 Linux CentOS 上使用 bosco 版本(condor 8.8.12) 7. web 界面允許用戶將作業添加到用戶池中。 但是,當我嘗試提交作業時,它 ...

刪除作業表單集群

[英]remove a job form cluster

我在 Linux 虛擬機上。 我知道有命令condor_submit hello.submit會將作業提交到集群。 但是,如果我想刪除提交的作業。 有辦法嗎? 我首先使用以下命令創建了一個用戶: sudo adduser user2然后使用命令su user2登錄到 user2,然后使用上面的代碼提 ...

Condor 錯誤:“$INT() 宏:50+ $((0/41)) 不計算為整數!”

[英]Error with Condor: "$INT() macro: 50+ $((0/41)) does not evaluate to an integer!"

我想用 Condor 運行多個作業,我的可執行文件作為參數b使得: b1=50+ $(($(Process)/41)) ,其中$(())代表$(Process)的商除以 41。 b在quotient.sh定義。 這是我的提交文件: 但是我收到錯誤Submitting job(s)ERROR at ...

2020-11-07 14:19:32   1   36    shell / condor  
HTCondor:在提交文件中,如何評估變量的值以便將其寫入輸出文件名?

[英]HTCondor: In the submit file, how to evaluate the value of a variable in order to write it in an output file name?

我想用 HTCondor 運行幾個作業,這是我的提交文件: 所以我的可執行文件將b1作為參數,它由$(Process)的函數定義。 我想在我的輸出文件中寫入b1的值。 問題是我得到了這樣的東西: 即使我嘗試定義b1=$(50+($(Process)%41)*10)我也一樣......知道如何 ...

2020-11-06 08:37:06   1   34    condor  
運行 python 作業時,如何讓 condor 自動導入我的 conda 環境?

[英]How do I have condor automatically import my conda environment when running my python jobs?

我正在將我的工作提交給 condor,但它說 tensorboard 沒有安裝,這是錯誤的,因為我遇到了一個交互式工作,所以它被安裝了。 如何讓 condor 使用我當前的活動 conda 環境? 我的禿鷹提交腳本: 我提交腳本的前幾行直到失敗行: 相關評論: 我確實看到了這個問題如 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM