cost 98 ms
如何在 ClearML Web UI 中管理數據集?

[英]How to manage datasets in ClearML Web UI?

使用帶有 clearml-data CLI 的自行部署 ClearML 服務器,我想在 WebUI 中管理(或查看)我的數據集,如 ClearML 網頁上所示( https://clear.ml/mlops/clearml-feature-store / ): 但是,此功能並未出現在我的 Web ...

ClearML 從記錄的值中獲取最大值

[英]ClearML get max value from logged values

我在訓練期間使用 ClearML 跟蹤我的張量板日志(來自 PyTorch Lightning)。 稍后,我啟動另一個腳本,該腳本連接到現有任務並進行一些測試。 但不幸的是,我在第二個腳本中沒有所有信息,所以我想從 ClearML 服務器的記錄值中查詢它們。 我該怎么做? 我想過這樣的事情,但沒有在 ...

ClearML Web UI 自定義列不持久

[英]ClearML Web UI custom column not persistent

我正在使用 ClearML Web UI 中的一個項目的實驗頁面來可視化一些自定義指標。 Therefore I've customized my table vie ( https://allegro.ai/clearml/docs/docs/webapp/webapp_exp_table.ht ...

單個腳本中的 ClearML 多個任務更改記錄的值名稱

[英]ClearML multiple tasks in single script changes logged value names

我為自定義超參數搜索訓練了具有不同配置的多個模型。 我使用 pytorch_lightning 及其日志記錄(TensorboardLogger)。 在 Task.init() 之后運行我的訓練腳本時,ClearML 會自動創建一個任務並將記錄器 output 連接到服務器。 我記錄每個應變階段tr ...

ClearML 服務器 IP 地址未與 localhost 和 SSH 端口轉發一起使用

[英]ClearML server IP address not used with localhost and SSH port forwarding

嘗試在自己的 Ubuntu 18.04.5 上使用 clearml-server。 我使用環境變量來設置我的 clearml-server 的 IP 地址。 但它仍然可以通過外部服務器 IP 獲得。 如何在 clearml-server 配置中停用外部 IP 的偵聽器? 編輯:據此:我使用 SSH ...

ClearML(以前的 Trains)可以在本地服務器上工作嗎?

[英]Can ClearML (formerly Trains) work a local server?

我正在嘗試從ClearML (以前稱為 Trains)開始。 我在 文檔中看到我需要在 ClearML 平台本身或使用 AWS 等的遠程機器上運行服務器。 我真的很想繞過這個限制並在我的本地機器上運行實驗,而不是連接到任何遠程目的地。 據此,我可以在任何遠程機器上安裝trains-server ...

火車:重用以前的任務 id

[英]Trains: reusing previous task id

我正在使用reuse_last_task_id=True來覆蓋現有任務(具有相同的項目和任務名稱)。 但是實驗包含火炬模型,因此不會覆蓋現有任務而是創建一個新任務。 如何從任務中分離模型? ...

pip install tr​​ains 失敗

[英]pip install trains fails

在我的虛擬環境中運行pip install trains時 我正進入(狀態 我知道在使用 venv 時我不應該在 sudo 下運行,所以我真的不明白這個問題 運行例如pip install pandas確實有效。 蟒蛇 3.8 如何安裝火車? 編輯: 運行pip install tra ...

Trains 會自動記錄 Tensorboard HParams 嗎?

[英]Will Trains automagically log Tensorboard HParams?

我知道可以將超參數作為字典發送到火車。 但是它也可以自動記錄使用 TF2 HParams 模塊記錄的超參數嗎? 編輯:這是在HParams 教程中使用hp.hparams(hparams) 。 ...

向 Trains 服務器報告的彈性如何?

[英]How resilient is reporting to Trains server?

在以下情況下,Trains go 如何將任何丟失的數據發送到服務器? 運行實驗時 Internet 連接暫時中斷互聯網連接中斷並且在實驗結束前沒有恢復(任何手動方式發送所有丟失的數據?) 運行 Trains 服務器的機器在實驗過程中重置 ...

火車:我可以重置任務的狀態嗎? (從“中止”回到“正在運行”)

[英]Trains: Can I reset the status of a task? (from 'Aborted' back to 'Running')

我不得不在中間停止訓練,這將 Trains 狀態設置為Aborted 。 后來我從最后一個檢查點繼續它,但狀態仍然是Aborted 。 此外,自動訓練指標不再出現在儀表板中(盡管自定義指標仍然存在)。 我可以將狀態重置回Running並讓 Trains 再次記錄訓練統計信息嗎? 編輯:繼續培訓時, ...

克隆實驗是否適用於 sklearn 函數?

[英]Does clone experiment work on sklearn functions?

我正在嘗試運行一個腳本,並且在 allegro.ai 中克隆實驗時不斷得到這個 AttributeError: 'Namespace' object has no attribute 'get' 有人可以幫忙嗎? ...

是否可以動態指定 Trains 配置文件或相對於運行腳本路徑?

[英]Can Trains config file be specified dynamically or relative to the running script path?

假設我有一個服務器,許多用戶在其中運行不同的實驗,可能使用不同的 Trains 服務器。 我知道TRAINS_CONFIG_FILE環境變量,但我想知道是否可以通過以下方式之一使其更加靈活: 動態指定 Trains 配置文件,即在訓練腳本運行期間? 在每個訓練存儲庫中存儲一個配置文件並指定其相對於 ...

使用 Trains 跟蹤單獨的訓練/測試過程

[英]Tracking separate train/test processes with Trains

在我的設置中,我運行一個腳本來訓練model 並開始生成檢查點。 另一個腳本監視新的檢查點並評估它們。 腳本並行運行,因此評估只是訓練的一個步驟。 支持這種情況的正確軌道配置是什么? ...

帶網格搜索的火車

[英]trains with grid search

我想在網格搜索期間測試火車的使用情況,但不清楚如何這樣做。 在演示服務器中創建一個實驗並記錄所有內容,但無論“task_name”和 可以使用不同的“task_name”調用,但不會將任何數據記錄到服務器中,而只會創建“草稿”。 這是一個示例代碼: 我的最后一次嘗試是: 它記錄了實 ...

從 AMI 移動到本地機器時如何備份/恢復 TRAINS 服務器

[英]How to Backup/Restore TRAINS-server when moving from AMI to local machine

我最近開始在 AWS AMI 中使用 TRAINS 和服務器。 我們目前使用的是 v0.9.0。 我想移動 TRAINS-server 以在我們的本地 kubernetes 集群上運行。 但是,我不想丟失 AWS 中當前服務器上的數據(實驗、模型、登錄等...)。 有沒有辦法備份當前服務器並將其恢 ...


排序:
質量:
 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM