问题标签 [knative-serving]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-kubernetes-engine - Cloud Run for Anthos 服务队列代理容器不断崩溃
我在 Google Kubernetes Engine 中管理的 kubernetes 集群上运行了 Cloud Run for Anthos 服务。
所有部署的服务突然停止响应。问题的原因是服务的 pod 的queue-proxy
容器开始循环崩溃。
我不熟悉 knative,我在互联网上找不到与 GKE 和特定容器相关的任何类似内容。
容器的日志对queue-proxy
我真的没有帮助,因为我不熟悉 knative:
在 Ready 状态更改为 CrashLoopBackoff 之前,它会重新启动几次,这会影响 pod 的就绪状态并使其不可用。GKE 为我的实际应用程序创建了另一个容器,user-container
该容器始终正常运行。在两次CrashLoopBackOff
重新启动之间的时间内,该服务可以访问并正常工作。
集群配置没有改变,我尝试升级节点的版本,但问题仍然存在。
我开始认为我被这个容器误导了,真正的原因在其他地方,但我不知道从哪里看,因为我实际上什么都没做。
你对如何解决这个问题有什么建议吗?
编辑:集群在1.18.17-gke.1901
我尝试过的版本上运行1.19.9-gke.1700
,1.20.7-gke.2200
但问题仍然存在
EDIT2:我刚刚在更新日志中遇到了这个问题:Version 1.18.18-gke.1700 is no longer available in the Stable channel.
可能是因为我的集群正在运行这个版本,它会自动升级吗?
kubernetes - 我们可以使用 Kata Container 运行时设置 Knative 集群吗?
我是轻量级虚拟机的新手。我将使用 Kata Container Runtime 安装 Knative。可能吗?
我知道 Kubernetes 与 Kata Container 运行时一起工作。但是,Knative 能正常工作吗?
kubernetes - 从 Kubeflow 管道提供自定义模型
我有一个训练自定义(即不基于 sklearn / tensorflow 等类)ml 模型的 kubeflow 管道。现在我想在管道末端添加服务。即我想在我的 Kubernetes 集群中有一个服务,它使用模型来回答预测请求,并且在每次管道运行后应该使用新模型更新该服务。
据我所知,为自定义模型提供服务,我应该:
将我的模型包装到 kfserving.KFModel 类中
使用 1) 运行的包装器创建 docker 映像
使用来自 2) 的图像创建 InferenceService 端点
在 Kubeflow 组件中是否有任何与云无关的方法来执行此操作?(所以基本上组件必须能够构建 docker 镜像)
有没有更好的方法来实现我的目的?
也许我应该将步骤 1-3 移到管道组件之外,只创建一个组件来触发 1-3 的外部执行。这可以做到吗?
docker - 当从 docker hub(公共存储库)使用图像时,部署的 knative 服务失败,原因是 RevisionMissing
我正在尝试在我的本地 Kubernetes 集群(Windows 的 Docker 桌面)中部署一个 knative 服务。当我使用来自谷歌云容器注册表 (gcr.io/knative-samples/helloworld-go) 的图像时,我可以创建一个 knative 服务,但是当我使用来自 docker hub 的图像时我遇到了一个问题。请注意,我没有在 Docker 注册表中使用任何私有存储库。
revision.serving 将在前 10 分钟内处于未知状态,然后更改为 false,原因是ProgressDeadlineExceeded。knative 服务失败,原因是RevisionMissing。我尝试使用来自 docker hub 的官方 hello-world 图像,并且响应是相同的。问题只是当我使用来自 docker 官方注册表的图像时,但现在使用 GCR 时。
下面是我用来创建 knative 服务的 Kubernetes 清单文件。
注意:我使用的是 knative-serving 1.0 版编辑:(我有隐藏的图像名称)
grpc-python - 如何使用 python 客户端调用 knative 服务 [grpc 服务器]
我在 aks 集群中创建了一个 knative 服务 [gRPC 服务器] ,我使用 istio 网关私有静态 IP 公开了该服务,
使用命令kubectl get ksvc后,我得到了一个地址sample-app.test.10.153.157.156.sslio.io
当我尝试在 python 客户端中使用此地址时,它会抛出错误,提示无法连接地址,但如果我尝试使用 curl sample-app.test.10.153.157.156.sslio.io 访问服务,我可以访问服务,我不知道我在这里缺少什么..请建议..
kubernetes - 如何根据自定义指标扩展 knative 服务?
我将 Knative 服务与 KPA 一起使用。基于并发和 RPS 的自动缩放在 Knative 中可用。但是我们需要根据队列长度来扩展不同的服务,因为有长时间运行的异步进程。我们有什么方法可以在 Knative 中实现这一点?我不能使用 Knative HPA,因为我们需要 Knative 的归零功能。提前致谢!
knative - Knative:为什么一个 Dockerfile “Readiness probe failed:” 而另一个没有?
kubectl 版本 --short
这个 Dockerfile 给出“Readiness probe failed”:
部署一个简单的 knative 服务:
错误
kubectl 描述 pod dockerfile-micro-depend-dhv8n-deployment-796484d788-hwpmm
在职的:
然后我找到了这个“官方”示例 并使用了 Dockerfile,它确实有效。你知道为什么吗?
显然它与对 pod 的一些健康检查有关,但我不知道为什么第一个 Dockerfile 不起作用。
kubernetes - 是否可以在“自动驾驶”模式下在 Google GKE 上安装 KNative?
是否可以在“自动驾驶”模式下在 Google GKE 上安装 KNative?不幸的是,我还没有找到任何关于这方面的教程,并且无法为这个项目使用托管解决方案,因为我的工作负载的 CPU 和内存资源太高了。(工作负载需要 40 个 CPU 内核和每个 KNative 事件 60GB RAM,这在 google cloud 功能、google cloud run 或 IBM Code Engine 上不受支持)。
非常感谢您的帮助
nginx - knative 服务不适用于 nginx 映像
你知道为什么 nginx 没有开始使用 Knative 吗?
使用标准部署没问题:
但是使用 Knative 服务 - 存在问题:
Kubectl 获取 ksvc:
kubectl 描述修订服务-web:
serverless - Knative 并行和序列演示失败
我正在尝试 knative 序列/并行流。
我从官方网站中提到的发布 v1.1 的序列示例开始,我创建了文档中提到的步骤、序列和 pingSource,但 pingSource 失败,因为序列未启动。
序列有以下异常
但步骤运行良好
在 knative 序列上花了很多时间后,我决定尝试 knative 并行
我参考了 v1.1 的并行官方文档并使用了多个分支示例我创建了过滤器、转换器、并行和 pingSource 但这里并行也没有出现以下异常
在这里,并行和序列也正常运行。
有没有人遇到过类似的问题,或者我错过了官方文档中的任何内容?
环境信息:
- 使用种类集群
- 使用本地 docker 注册表(已绕过对图像的摘要检查)
- 命名空间:varadhi
- Serving 和 Eventing CRDS 是 knative v1.1
编辑#1
我没有显式创建任何通道,也没有看到控制器隐式创建任何通道
我的默认频道也是 InMemoryChannel
平行 :
使用示例:https ://github.com/knative/docs/tree/main/code-samples/eventing/parallel/multiple-branches
地位
编辑#2 我安装了更多的事件 crds (eventing.yaml)
我现在可以看到的变化很少。
正在创建频道并且其状态为 true
但序列和并行尚未处于真实状态,他们说订阅未就绪
在进一步调试时,我可以依次看到以下消息
并在查看频道时,它会给出以下消息
看起来频道无法获取服务部署状态
我也安装了 Kourier 但我看不到外部 IP。请注意,我正在为此运行我自己的集群。
安装 kourier 后服务几乎没有变化
IngressNotConfigured 状态消失。