我们在 EC2 实例 AWS 云上管理我们自己的 ClearML 服务器。 实例类型:t3.xlarge(4 个 vCPU,16 GiB 内存)。 数据盘:gp3(大小:200GB,IOPS:3000,Throughput:125)。 我们有 3 个 ClearML 项目,一个有 643,000 个 ...
我们在 EC2 实例 AWS 云上管理我们自己的 ClearML 服务器。 实例类型:t3.xlarge(4 个 vCPU,16 GiB 内存)。 数据盘:gp3(大小:200GB,IOPS:3000,Throughput:125)。 我们有 3 个 ClearML 项目,一个有 643,000 个 ...
我已经使用 ClearML Docker-Compose 安装了 ClearML 测试管理器解决方案。所以现在整个事情正在使用 6 个容器(webserver、apiserver、redis、elasticsearch、fileserver 和 mongodb)运行。 我正在运行默认的清理服务 - ...
我想为某个 ClearlML 项目和任务下载性能最好的 model。 我的 ClearML 实验平台中有以下内容: 我尝试了以下方法:try: import clearml from clearml import Dataset, Task assert hasattr( ...
我有一个与 ClearML plot 日志记录相关的问题。 我们目前正在使用: 报告表格。 它们出现在“绘图”部分下。 同样,我们报告 plotly 图: 两者都工作正常。 问题是,每个新的report_plotly调用,而不是替换部分中的图像,而是创建一个新的,并保留前一个。 这会阻塞 PLOT ...
ClearML 是现有最著名的 MLOps 工具之一。 它记录了机器学习过程,但是我找不到任何有关其信息安全事件会计系统的信息。 我的问题是:ClearML 有这样的系统吗? 它是否注册/记录客户端-服务器交互的事件? 如果 ClearML 可以,那么使用什么格式? ...
最近开始使用 ClearML 来管理 MLOps,我面临以下问题:当运行一个脚本,使用我的计算机上的不同 class 权重在二进制分类问题中训练 CatBoost 时,它运行良好,记录结果并且完全没有问题. 一旦我尝试使用 ClearML 代理远程运行它,就会导致以下错误: 我确实连接了字典: 在 ...
在 ClearML Dataviews 中,可以添加扩充。 这些增强在哪里运行? 选项原始数据被下载到本地,然后运行(在哪个设备上?如何处理多处理?) 只有增强的数据被下载到本地缓存,增强远程运行(谁支付计算费用?多快?应该相应地更改管道吗?) 我在文档中找不到这个。 ...
我在运行此命令“docker-compose --env-file example.env -f docker-compose-triton.yml up”时发现了这个错误。 实际上,当我第一次运行此命令时,它起作用了。 然后,当我尝试更改为我朋友的工作区时,当我再次运行该命令时,它突然出现此错误。 ...
我正在尝试使用ClearML 。 我文件中的唯一行是 产生 看起来缺少一些 pip 包,但我一生都无法在文档中找到它。 我应该点安装什么? 不工作: pip install clearml-agent pip install clearml和clearml-init在这里 ...
我想远程执行 ClearML 任务。 根据文档,有两个选项:1)执行单个 python 文件; 2) ClearML 将识别该脚本是 repo 的一部分,该 repo 将被克隆并安装到 docker 并在 worker 上执行。 在第二种情况下,假设 repo 具有远程 url 并且可以由工作人员 ...
我想让我的 clearml 代理不要为每个任务安装 python envs,这需要很长时间。 我尝试了如下设置配置:package_manager.system_size_packages=true,但它不起作用。 clearml 代理将不再安装 python 环境 ...
我正在尝试使用本教程在 AWS ALB 中为 ClearML 服务器配置基于主机的路由。 但是,我没有域名。 那么这个路由只能用alb的dns吗? 例如,我将地址作为 app. .ap-东北-1.elb.amazonaws.com,api。.ap-东北-1.elb.amazonaws.com。 ...
我想在 kube.netes 环境中部署一个 ClearML 代理,同时使用 ClearML 的免费层演示服务器。 我能够使用allegroai/clearml-agent docker 图像在 k8s 集群中部署 Agent pod。 但是无法将此代理链接到 ClearML 演示服务器。 谁能帮 ...
我可以从 API 服务器获得任何指标吗? 或者我可以指向后端并获得一些指标的任何 docker 图像? 最重要的是查看实时运行的任务数量(就像我们可以在工作人员页面上看到的那样)以及检查每个任务运行了多少时间(也可以在工作人员页面上找到) 如果不存在,他们是否有 API 来获取所有这些信息? ...
我已经使用子域方法在 GCP 中设置了 ClearML 服务器。 I can access all three domains ( https://app.clearml.mydomain.com , https://api.clearml.mydomain.com and https://fi ...
我正在使用 clearml 测试算法,它与库Stable Baselines 3配合得很好,其中 clearml 自动捕获标量选项卡中的所有 output 和 plot。 但是,当我切换到另一个库时, PFRL clearml 不再对“标量”选项卡进行 output 任何操作。 查看代码后,我发现 ...
在将用作 ClearML 代理的 docker 映像中安装 S3 容器的最佳实践是什么? 我可以想到 3 个解决方案,但目前无法使任何解决方案工作: 在 ClearML 中使用预制配置,特别是 CLEARML_AGENT_K8S_HOST_MOUNT。 为此,S3 存储桶将使用rclone单独安装 ...
使用带有 clearml-data CLI 的自行部署 ClearML 服务器,我想在 WebUI 中管理(或查看)我的数据集,如 ClearML 网页上所示( https://clear.ml/mlops/clearml-feature-store / ): 但是,此功能并未出现在我的 Web ...
我在训练期间使用 ClearML 跟踪我的张量板日志(来自 PyTorch Lightning)。 稍后,我启动另一个脚本,该脚本连接到现有任务并进行一些测试。 但不幸的是,我在第二个脚本中没有所有信息,所以我想从 ClearML 服务器的记录值中查询它们。 我该怎么做? 我想过这样的事情,但没有在 ...
我正在使用 ClearML Web UI 中的一个项目的实验页面来可视化一些自定义指标。 Therefore I've customized my table vie ( https://allegro.ai/clearml/docs/docs/webapp/webapp_exp_table.ht ...