问题标签 [clearml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
devops - ClearML Web UI 自定义列不持久
我正在使用 ClearML Web UI 中项目的实验页面来可视化一些自定义指标。因此,我已经自定义了我的表格 vie ( https://allegro.ai/clearml/docs/docs/webapp/webapp_exp_table.html?highlight=customize#adding-metrics ) 但是每当我离开另一个项目的页面并返回时,该表将被重置。有没有办法存储特定项目的配置?
devops - ClearML 从记录的值中获取最大值
我在训练期间使用 ClearML 来跟踪我的 tensorboard 日志(来自 PyTorch Lightning)。稍后,我启动另一个脚本,该脚本连接到现有任务并进行一些测试。
但不幸的是,我在第二个脚本中没有所有信息,所以我想从 ClearML 服务器的记录值中查询它们。
我该怎么做?
我想过这样的事情,但没有在文档中找到任何东西:
x_value
将是我的时代或全球步骤y_value
图“val/acc”的最大值x_value2
将是我的时代或全球步骤y_value2
情节“时代”的价值x_value
clearml - 如何在 ClearML Web UI 中管理数据集?
使用带有 clearml-data CLI 的自行部署 ClearML 服务器,我想在 WebUI 中管理(或查看)我的数据集,如 ClearML 网页上所示(https://clear.ml/mlops/clearml-feature-store / ):
但是,此功能不会出现在我的 Web UI 中。根据定价页面,功能商店不是高级功能。我是否需要以特殊方式配置我的服务器才能使用此功能?
docker - 在 clearml 代理中的 docker 中安装 S3 存储桶
在将用作 ClearML 代理的 docker 映像中安装 S3 容器的最佳实践是什么?我可以想到 3 个解决方案,但目前无法使任何解决方案工作:
- 在 ClearML 中使用预制配置,特别是 CLEARML_AGENT_K8S_HOST_MOUNT。为此,S3 存储桶将使用rclone单独安装在主机上,然后重新映射到 docker。这似乎只适用于 Kubernetes 而不是 Docker——因此不起作用。
- 使用此处指定的 s3fuse 进行安装。问题是它可以与存储在 ClearML 浏览器会话中的 S3 存储桶密码一起使用吗?这似乎也很复杂,需要自定义 docker 镜像,更不用说以 --privileged 或类似方式运行 docker 镜像了。
- 使用1.0 发行说明中指定的“docker_args 和 docker_bash_setup_script 参数到 Task.create()”将参数传递给 docker 。这将类似于 (1),但参数将用于绑定安装卷。我没有看到太多关于如何将此新功能用于此目的的文档或示例。
devops - ClearML 如何获得可配置的超参数?
如何在超参数下的 UI 配置面板中显示像 epochs 这样的参数?我希望能够从 UI 中更改时期数和学习率。
clearml - Clearml 超参数优化 - 任务克隆旧提交,然后在 git diff 上失败
我尝试使用 clearml(版本 1.0.5)启动超参数优化。每个单独的实验做的第一件事是使用缓存版本检查 repo。它检查一个没有这些特定文件的旧提交(几天前),然后在 git diff 上失败。我尝试了以下方法: 1)删除缓存 - vcs-cache 和所有缓存。我可以看到它确实有效果,因为在删除缓存后启动确实需要更长的时间,所以它消失了。2)确保我的遥控器是最新的并与我的本地版本同步。3)检查了 clearml.conf 文件和 clearml-agent 配置文件 - 没有找到任何存储要拉取的提交的内容。
还有另一个问题与 git diff 相关,但与这种异步性无关。在尝试解决问题的过程中,我切换到我的主分支并从远程拉,这工作正常。然后我尝试再次运行该任务,但由于新文件导致“文件名太长”错误而失败(这是我在计算机上禁用的 Windows 问题,但由于某种原因在 clearml 中发生)。即使从我的版本中删除该文件会修复它(没有尝试),这也是不好的做法。
是否有解决这些问题的方法/禁用 git diff 的方法?
python - 如何使用 clearml 捕获记录器值
我正在使用 clearml 来测试算法,它与库Stable Baselines 3配合得很好,其中 clearml 自动捕获所有输出并将它们绘制在 Scalars 选项卡中。
但是,当我切换到另一个库时,PFRL clearml 不再向标量选项卡输出任何内容。在查看代码后,我发现 PFRL 使用 输出统计信息logger.info
,这似乎是空 Scalars 选项卡的原因(但控制台选项卡中有输出)。我想知道是否有任何方法可以让 clearml 自动将它们收集到“标量”选项卡中。
提前致谢!
clearml - 什么会阻止凭据在 ClearML 服务器上进行验证?
我已经使用子域方法在 GCP 中设置了 ClearML 服务器。我可以在浏览器中访问所有三个域(https://app.clearml.mydomain.com
和https://api.clearml.mydomain.com
)https://files.clearml.mydomain.com
并查看我认为正确的响应,但是当通过 python SDK 连接时clearml-init
出现以下错误:
是否有任何可能导致此错误的原因?
prometheus - 将 ClearML 的指标导出到 Prometheus 并在 Grafana 中显示
我可以从 API 服务器获得任何指标吗?或者我可以指向后端并获取一些指标的任何 docker 图像?最重要的是查看实时运行了多少任务(就像我们可以在工作人员页面上看到的那样)以及检查每个任务运行了多少时间(也可以在工作人员页面上找到)
如果不存在,他们是否有获取所有这些信息的 API?
kubernetes - 如何在 k8s 设置中部署 ClearML 代理?
我想在 kubernetes 环境中部署 ClearML 代理,同时使用 ClearML 的免费层演示服务器。我能够使用 dockerallegroai/clearml-agent
映像在 k8s 集群中部署 Agent pod。但无法将此代理链接到 ClearML Demo 服务器。谁能帮我解决为 CLearML 代理的 k8s pod 配置 API 访问和密钥的问题。