问题标签 [kubeflow-pipelines]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

182 问题

0 投票

4 回答

2408 浏览

python - kubeflow 管道动态输出列表作为输入参数

我在动态列表上使用 ParallelFor。我想从循环中收集所有输出，并将它们传递给另一个 ContainerOp。
像下面这样的东西，显然不起作用，因为outputs列表是静态的。

2019-12-22T14:38:33.573

0 投票

0 回答

211 浏览

kubernetes - 如何将 GCP 机密附加到 Kubernetes 服务帐户？

如何使用从谷歌云 JSON 文件创建的秘密对象到服务帐户？我已经minikf在VM上并kubeflow安装了。我正在尝试在Kubernetes 集群中使用Jupyter笔记本制作一个容器。minikf笔记本可以使用 PodDefault 访问 GCP，但notebook自动启动的 kanico 容器无法访问 GCP。jupyter notebook中构建容器的代码如下：

我得到错误：

以 Kaniko 开头的 pod 名称被创建并失败，因为它无法访问谷歌云存储：

Jupyter notebook 能够利用我的秘密对象“user-gcp-sa”的证明是上面的代码正在 GCS 上准备文件：

kubernetes kubeflow kubeflow-pipelines

2020-01-16T06:05:22.133

0 投票

2 回答

112 浏览

python - 如何升级现有的 kubeflow 管道？

在管道 UI 中，我使用上传管道按钮来上传新管道。

由于管道名称是唯一的，因此更新的唯一方法是删除旧管道，然后上传新管道。

有没有更好的方法，也许可以管理单个管道名称的版本？

python kubeflow kubeflow-pipelines

2020-01-20T17:01:23.257

0 投票

7 回答

10444 浏览

tensorflow2.0 - 完成 GeneratorDataset 迭代器时发生错误：已取消：操作已取消

在运行具有使用 tensorflow 2.0 的代码的 kubeflow 管道时。每个时期结束时显示以下错误

W tensorflow/core/kernels/data/generator_dataset_op.cc:103] 完成 GeneratorDataset 迭代器时发生错误：已取消：操作已取消

此外，经过一些时期后，它不会显示日志并显示此错误

此步骤处于失败状态，并显示以下消息：节点资源不足：内存。Container main 使用 100213872Ki，超过了它的请求 0。Container wait 使用了 25056Ki，超过了它的请求 0。

tensorflow2.0 kubeflow kubeflow-pipelines

2020-01-31T08:49:38.417

0 投票

2 回答

1426 浏览

machine-learning - 如何为 KubeFlow 管道构建映像？

我最近发现了 kubeflow 和 kubeflow 管道，但我不清楚如何从我的 python 程序构建图像。

假设我有一个简单的 Python 函数来裁剪图像：

我应该如何将它容器化并在 KubeFlow 管道中使用它？我需要将它包装在 API 中（例如使用 Flask）还是需要连接到一些媒体/数据代理？

KubeFlow 管道如何将输入发送到此代码并将此代码的输出传输到下一步？

machine-learning kubernetes kubeflow kubeflow-pipelines

2020-02-03T14:59:38.827

0 投票

1 回答

135 浏览

kubeflow - UI 可以在 kubeflow-pipelines 中显示不是 PipelineParam 的输入参数吗？

在 kubeflow-pipelines 中，UI 将 PipelineParam 显示为输入参数。

但是，我想确认不是 PipelineParam 而是常量值的值。有没有办法在 UI 中显示值？

例如，在以下情况下，UI 中仅显示 param_a。

kubeflow kubeflow-pipelines

2020-02-20T04:08:26.980

0 投票

0 回答

202 浏览

docker - Kubeflow 是否可以将本地文件夹挂载到多个容器操作？

我有一个包含我的环境的 docker 容器，然后我在本地机器上有 2 个要运行的文件。first_script.py并且second_script.py我的图像被称为my_env:3.7.

在 kubeflow 中，我想创建一个管道，其中first step --> second step. 由于两个脚本的环境相同，我想使用相同的 docker 映像，所以我只需要将文件添加到容器中。但我该怎么做呢？

我不想为 2 个单独的脚本提供 2 个单独的图像。

docker kubernetes pipeline kubeflow kubeflow-pipelines

2020-02-28T12:58:44.133

0 投票

2 回答

398 浏览

apache-kafka - 是否可以让 Kubeflow 推理管道 (KFServing) 将消息发布到 Kafka？

我开始使用 Kubeflow，并且阅读了有关 KFServing 的信息。与 Kafka 有这种集成，可以从主题中消费。我需要运行一个推理管道，该管道使用来自 Kafka 的数据，进行一些数据预处理，运行 ML 预测，然后将结果发布回 Kafka，如下所示：

我知道我可以使用 Knative 事件从 Kafka 主题 1 摄取数据。有没有办法将 Kafka 用作接收器，或者我是否需要编写一个单独的容器将事件发布到 Kafka 主题 2？

谢谢！

apache-kafka kubeflow kubeflow-pipelines knative-eventing

2020-03-03T10:53:26.260

0 投票

1 回答

284 浏览

google-cloud-platform - 同一个 GCP 项目中的 Kubeflow 管道存储访问错误？

在新的 GKE 集群上安装 Kubeflow 0.7 后（通过https://deploy.kubeflow.cloud），我已经根据各自的教程配置了 OAuth 和 Workload Identity。

在我的管道上，我必须从同一个项目访问 GCS 存储桶，而且我似乎无权访问此操作。

但是，集群确实有权访问 GCR，并且存储权限确实下载和挂载 Docker 映像并运行代码。当代码请求时，它无法从其他存储桶下载，即使这些存储桶在同一个项目中也是如此。

该代码使用默认的身份验证方法：

有没有人知道如何通过访问 BigQuery 来解决和防止这种情况发生（将在下载这些文件后访问）

google-cloud-platform kubeflow kubeflow-pipelines

2020-03-16T14:18:20.300

0 投票

2 回答

448 浏览

python-3.x - 如何从 kubeflow 管道 0.2.5 中的容器化组件中导出指标

我有一个由 3 个容器化组件组成的管道。在最后一个组件中，我将我想要的指标写入一个名为的文件/mlpipeline-metrics.json，就像这里解释的那样。这是我使用的 Python 代码。

我还尝试使用以下代码编写文件，就像上面链接的示例一样。

管道运行良好，没有任何错误。但它不会在前端 UI 中显示指标。

我认为这与以下代码块有关。

这是我用来ContainerOp从容器化组件创建的代码。请注意，我没有指定任何file_outputs. 在其他ContainerOp方面，我必须指定file_outputs能够将变量传递给管道中的下一步。我应该在这里做类似的事情来将它映射/mlpipeline-metrics.json到某个东西上，以便 kubeflow 管道检测到它吗？

我正在使用运行 Kubeflow Pipelines 0.2.5 和 Python 3.6.8 的托管 AI 平台管道部署。

任何帮助表示赞赏。

python-3.x kubeflow-pipelines

2020-03-18T13:23:55.613

1 2 3 4 5 6 7 8 9 10

问题标签 [kubeflow-pipelines]

Reference