[英]How to manage datasets in ClearML Web UI?
使用帶有 clearml-data CLI 的自行部署 ClearML 服務器,我想在 WebUI 中管理(或查看)我的數據集,如 ClearML 網頁上所示( https://clear.ml/mlops/clearml-feature-store / ): 但是,此功能並未出現在我的 Web ...
[英]How to manage datasets in ClearML Web UI?
使用帶有 clearml-data CLI 的自行部署 ClearML 服務器,我想在 WebUI 中管理(或查看)我的數據集,如 ClearML 網頁上所示( https://clear.ml/mlops/clearml-feature-store / ): 但是,此功能並未出現在我的 Web ...
[英]ClearML get max value from logged values
我在訓練期間使用 ClearML 跟蹤我的張量板日志(來自 PyTorch Lightning)。 稍后,我啟動另一個腳本,該腳本連接到現有任務並進行一些測試。 但不幸的是,我在第二個腳本中沒有所有信息,所以我想從 ClearML 服務器的記錄值中查詢它們。 我該怎么做? 我想過這樣的事情,但沒有在 ...
[英]ClearML Web UI custom column not persistent
我正在使用 ClearML Web UI 中的一個項目的實驗頁面來可視化一些自定義指標。 Therefore I've customized my table vie ( https://allegro.ai/clearml/docs/docs/webapp/webapp_exp_table.ht ...
[英]ClearML multiple tasks in single script changes logged value names
我為自定義超參數搜索訓練了具有不同配置的多個模型。 我使用 pytorch_lightning 及其日志記錄(TensorboardLogger)。 在 Task.init() 之后運行我的訓練腳本時,ClearML 會自動創建一個任務並將記錄器 output 連接到服務器。 我記錄每個應變階段tr ...
[英]ClearML SSH port forwarding fileserver not available in WEB Ui
嘗試在自己的 Ubuntu 18.04.5 上使用 clearml-server 和 SSH 端口轉發,但無法看到我的調試示例。 我的設置: 主機 A 上的 ClearML 服務器 SSH 通過 localhost:18080 從工作機器訪問 Web 應用程序的隧道連接 Web 應用程序: ssh ...
[英]ClearML server IP address not used with localhost and SSH port forwarding
嘗試在自己的 Ubuntu 18.04.5 上使用 clearml-server。 我使用環境變量來設置我的 clearml-server 的 IP 地址。 但它仍然可以通過外部服務器 IP 獲得。 如何在 clearml-server 配置中停用外部 IP 的偵聽器? 編輯:據此:我使用 SSH ...
[英]Can ClearML (formerly Trains) work a local server?
我正在嘗試從ClearML (以前稱為 Trains)開始。 我在 文檔中看到我需要在 ClearML 平台本身或使用 AWS 等的遠程機器上運行服務器。 我真的很想繞過這個限制並在我的本地機器上運行實驗,而不是連接到任何遠程目的地。 據此,我可以在任何遠程機器上安裝trains-server ...
[英]Trains: reusing previous task id
我正在使用reuse_last_task_id=True來覆蓋現有任務(具有相同的項目和任務名稱)。 但是實驗包含火炬模型,因此不會覆蓋現有任務而是創建一個新任務。 如何從任務中分離模型? ...
[英]pip install trains fails
在我的虛擬環境中運行pip install trains時 我正進入(狀態 我知道在使用 venv 時我不應該在 sudo 下運行,所以我真的不明白這個問題 運行例如pip install pandas確實有效。 蟒蛇 3.8 如何安裝火車? 編輯: 運行pip install tra ...
[英]How should Trains be used with hyper-param optimization tools like RayTune?
什么是合理的設置? 我可以在同一次執行中多次調用 Task.init() 嗎? ...
[英]Will Trains automagically log Tensorboard HParams?
我知道可以將超參數作為字典發送到火車。 但是它也可以自動記錄使用 TF2 HParams 模塊記錄的超參數嗎? 編輯:這是在HParams 教程中使用hp.hparams(hparams) 。 ...
[英]How resilient is reporting to Trains server?
在以下情況下,Trains go 如何將任何丟失的數據發送到服務器? 運行實驗時 Internet 連接暫時中斷互聯網連接中斷並且在實驗結束前沒有恢復(任何手動方式發送所有丟失的數據?) 運行 Trains 服務器的機器在實驗過程中重置 ...
[英]Trains: Can I reset the status of a task? (from 'Aborted' back to 'Running')
我不得不在中間停止訓練,這將 Trains 狀態設置為Aborted 。 后來我從最后一個檢查點繼續它,但狀態仍然是Aborted 。 此外,自動訓練指標不再出現在儀表板中(盡管自定義指標仍然存在)。 我可以將狀態重置回Running並讓 Trains 再次記錄訓練統計信息嗎? 編輯:繼續培訓時, ...
[英]Does clone experiment work on sklearn functions?
我正在嘗試運行一個腳本,並且在 allegro.ai 中克隆實驗時不斷得到這個 AttributeError: 'Namespace' object has no attribute 'get' 有人可以幫忙嗎? ...
[英]Can Trains config file be specified dynamically or relative to the running script path?
假設我有一個服務器,許多用戶在其中運行不同的實驗,可能使用不同的 Trains 服務器。 我知道TRAINS_CONFIG_FILE環境變量,但我想知道是否可以通過以下方式之一使其更加靈活: 動態指定 Trains 配置文件,即在訓練腳本運行期間? 在每個訓練存儲庫中存儲一個配置文件並指定其相對於 ...
[英]Tracking separate train/test processes with Trains
在我的設置中,我運行一個腳本來訓練model 並開始生成檢查點。 另一個腳本監視新的檢查點並評估它們。 腳本並行運行,因此評估只是訓練的一個步驟。 支持這種情況的正確軌道配置是什么? ...
[英]Parallel Coordinates Plot in TRAINS
有沒有辦法在火車中創建平行坐標 plot ( https://github.com/allegroai/trains ) package 來比較幾個超參數? ...
[英]trains with grid search
我想在網格搜索期間測試火車的使用情況,但不清楚如何這樣做。 在演示服務器中創建一個實驗並記錄所有內容,但無論“task_name”和 可以使用不同的“task_name”調用,但不會將任何數據記錄到服務器中,而只會創建“草稿”。 這是一個示例代碼: 我的最后一次嘗試是: 它記錄了實 ...
[英]How to Backup/Restore TRAINS-server when moving from AMI to local machine
我最近開始在 AWS AMI 中使用 TRAINS 和服務器。 我們目前使用的是 v0.9.0。 我想移動 TRAINS-server 以在我們的本地 kubernetes 集群上運行。 但是,我不想丟失 AWS 中當前服務器上的數據(實驗、模型、登錄等...)。 有沒有辦法備份當前服務器並將其恢 ...
[英]How to manually register a sci-kit model with TRAINS python auto-magical experiment manager?
我主要使用 scikit-learn,據我所知,TRAINS auto-magic 不會自動捕獲 scikit-learn 模型存儲/加載。 我如何在“腌制”模型后手動注冊模型。 例如: ...