我在使用“使用托管存储”设置 GCP AI Platform Pipelines - Kubeflow Pipelines v1.4.1 时遇到问题 没有任何配置不允许我(KFP 服务上的错误)使用“使用托管存储”,但让我们专注于描述的特定一个以下。
我的设置是:
- 自定义网络/子网中版本为“1.17.15-gke.800”的专用集群并启用工作负载身份
- 与 GKE 相同的自定义网络/子网中的私有 mysql 8.0
- 地面站
- “使用托管存储”,其中指定了所有必需的信息:GCS 名称、数据库的连接名称、用户、密码和数据库前缀
- 使用的工作负载身份(为了简化所有 KSA(K8s 服务帐户)被映射到具有所有者角色的单个 Google 服务帐户)
请注意,在没有选项“使用托管存储”的情况下,使用 GKE 和 KFP 进行设置可以正常工作,但如果使用“使用托管存储”,它会失败:
- 毫升管道:
- 地位:
- Pod 错误:CrashLoopBackOff
- 没有最低可用性
- 日志:
packets.go:36: unexpected EOF
CETdriver: bad connection
- 元数据-grpc-部署:
- 地位:
- Pod 错误:CrashLoopBackOff
- 没有最低可用性
- 日志:
Non-OK-status: status status: Internal: mysql_real_connect failed: errno: 2013, error: Lost connection to MySQL server at 'handshake: reading inital communication packet', system error: 11MetadataStore cannot be created with the given connection config.
- cloudsqlproxy & mysql(相同的日志):
- 状态:好的
- 日志:
couldn't connect to "<db_connection_string>": googleapi: Error 401: Request had invalid authentication credentials. Expected OAuth 2 access token, login cookie or other valid authentication credential. See https://developers.google.com/identity/sign-in/web/devconsole-project.
More details:
Reason: authError, Message: Invalid Credentials
cloudsqlproxy 服务/pod 中似乎存在问题,无法建立与数据库的连接。这是此功能中的错误还是配置错误?