![](/img/trans.png)
[英]Bash help. module load function not working
我在這里要瘋了,請幫助我。 我有一個批處理腳本,我最終想通過 condor_submit 在集群上執行。 該腳本需要通過“module load matlab/R2020a”加載一些模塊。 但是沒有任何效果。 該腳本如下所示: 當我從我的家庭 shell 運行它時,它給了我: 這兩者都不正確。 在我 ...
[英]Bash help. module load function not working
我在這里要瘋了,請幫助我。 我有一個批處理腳本,我最終想通過 condor_submit 在集群上執行。 該腳本需要通過“module load matlab/R2020a”加載一些模塊。 但是沒有任何效果。 該腳本如下所示: 當我從我的家庭 shell 運行它時,它給了我: 這兩者都不正確。 在我 ...
[英]How to log the errors both stdout and sterr files in the HTCondor HPC manager?
我想將錯誤記錄到 stderr 和 stdout,如何做到這一點? 這是我當前的腳本: ...
[英]error "Shadow pid 3161 for job 14.0 exited with status 4" (condor jobs are not running..)
我在禿鷹集群上運行工作,它的顯示錯誤.. “作業 14.0 的影子 pid 3161 以狀態 4 退出” #condor_q -分析 14 最后一次成功的比賽:2022 年 7 月 18 日星期一 12:40:34 014.000:忽略用戶優先級運行分析摘要。 在 192 台機器中, ...
[英]HTCondor - Partitionable slot not working
我正在按照 HTCondor 網站中關於高吞吐量計算中心和配置簡介的教程來設置一個可分區插槽。 在我運行任何配置之前 並得到以下輸出。 我通過在文件末尾添加以下行來更新/etc/condor/config.d中的文件00-minicondor 。 並重新配置 現在有了 我按預期得到 ...
[英]Can I mix bash script in HTcondor script?
我正在向禿鷹提交一份工作。 傳遞給可執行文件的參數是 bash 腳本生成的數值。 是否可以以這種方式混合 condor 和 bash 腳本? ...
[英]Submitting parallel jobs on HTCondor, using python
我正在嘗試在 HTCondor 上循環提交並行作業,以下是 python 腳本的一個簡單示例 - 我想通過 for 循環(即 10 個作業)同時將每個作業( results )提交給 10 台機器,然后將所有結果合並到一個 pickle 中。 我有這個工作的提交腳本如下 - 我想知道如何提交 10 ...
[英]Why converting to int the Process Id in Condor doesn't work this way?
所以我有以下 HTCondor 提交有效的描述: 為什么我不能這樣做呢? ...
[英]Condor master node and workers only see the master node
我正在嘗試設置 HTCondor 批處理系統,但是當我執行condor_status ,它只在主節點和工作節點中顯示主節點。 他們都展示了這一點: 主節點上的Condor_restart工作正常,但在工作節點上產生此錯誤: 以下是配置文件: 主節點: 工作節點: 我允許在同一個安全 ...
[英]Error getting the correct Python3 dependency
嘗試在 Amazon Linux 2 實例上安裝 HTCondor 時出現此錯誤: 我嘗試自己安裝 python 3.6(假設安裝的是 3.7),在 /usr/local/lib 中有 libpython3.6m.so.1.0。 這和 libpython3.6m.so.1.0()(64bit) ...
[英][HTCONDOR][kubernetes / k8s] : Unable to start minicondor image within k8s - condor_master not working
后期編輯問題是由於: PSP ( Pod security policy )默認情況下不允許我的condor用戶升級。 這就是它不起作用的原因。 因為supervisord以root用戶身份運行並嘗試寫入日志並以root而不是其他用戶(即condor )啟動 condor 收集器描述 mini-c ...
[英]Condor running python successfully, but doesn't show output files
我是 HTCondor 的新手,我正在嘗試在 condor 系統上運行 python 腳本。 我想在我的代碼中使用 cv2 和 numpy,同時能夠在完成后讀取我的打印和腌制數據。 當前代碼運行並完成(日志文件:返回值 0)。 但是condor_bin.out在我的打印件應該出現的condor_b ...
[英]How does one get the job ID of an interactive job from an environment variable when using condor?
我通常通過以下方式獲得工作 ID: 但如果它是一項交互式工作,我看不到它的設置。 有沒有辦法設置它? 當我獲得資源時,我看到我的工作有一個工作 ID。 有沒有辦法得到它? 這是應該的 ...
[英]How can one change the set up in condor so that users don't have to chmod their experiment scripts?
目前,condor 集群的用戶必須執行以下操作: 能夠使用 condor_submit 運行他們的腳本。 如何設置 condor 以使用戶不再需要這樣做? 這里的獎勵是一個用戶示例提交腳本: ...
[英]Make current file & the extension with condor match output & error files? (to have PBS and Slurm have same output files)
如何使禿鷹命名我的文件如下: meta_learning_experiments_submission.py.e451863 meta_learning_experiments_submission.py.o444375 我試過了,但它似乎不起作用。 例如,當我執行qsub時它匹配 PBS 的默 ...
[英]Gahp server (failure issues ) exited with status 1 unexpectedly
我正在開發一個基於 Web 的工具(名為 cloudcopasi),它從用戶那里獲取工作並將其提交給 bosco 資源(計算節點)。 我在 Linux CentOS 上使用 bosco 版本(condor 8.8.12) 7. web 界面允許用戶將作業添加到用戶池中。 但是,當我嘗試提交作業時,它 ...
[英]remove a job form cluster
我在 Linux 虛擬機上。 我知道有命令condor_submit hello.submit會將作業提交到集群。 但是,如果我想刪除提交的作業。 有辦法嗎? 我首先使用以下命令創建了一個用戶: sudo adduser user2然后使用命令su user2登錄到 user2,然后使用上面的代碼提 ...
[英]How does one submit a job requesting a specific GPU in condor without a submission file?
我想要做: 但由於空格和逗號,我不能這樣做。 我也試過: 但它失敗了。 它確實適用於提交文件,例如 所以請不要建議我已經有那個工作了。 我希望它在命令行上的一行中。 謝謝! ...
[英]Error with Condor: "$INT() macro: 50+ $((0/41)) does not evaluate to an integer!"
我想用 Condor 運行多個作業,我的可執行文件作為參數b使得: b1=50+ $(($(Process)/41)) ,其中$(())代表$(Process)的商除以 41。 b在quotient.sh定義。 這是我的提交文件: 但是我收到錯誤Submitting job(s)ERROR at ...
[英]HTCondor: In the submit file, how to evaluate the value of a variable in order to write it in an output file name?
我想用 HTCondor 運行幾個作業,這是我的提交文件: 所以我的可執行文件將b1作為參數,它由$(Process)的函數定義。 我想在我的輸出文件中寫入b1的值。 問題是我得到了這樣的東西: 即使我嘗試定義b1=$(50+($(Process)%41)*10)我也一樣......知道如何 ...
[英]How do I have condor automatically import my conda environment when running my python jobs?
我正在將我的工作提交給 condor,但它說 tensorboard 沒有安裝,這是錯誤的,因為我遇到了一個交互式工作,所以它被安裝了。 如何讓 condor 使用我當前的活動 conda 環境? 我的禿鷹提交腳本: 我提交腳本的前幾行直到失敗行: 相關評論: 我確實看到了這個問題如 ...