问题标签 [azure-container-service]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kubernetes - Kubernetes监控服务heapster不断重启
我正在使用 azure 的容器引擎运行 kubernetes 集群。我对其中一项 kubernetes 服务有疑问,该服务执行资源监控heapster
。吊舱每分钟或类似的东西重新启动一次。我尝试删除 heapster 部署、副本集和 pod,然后重新创建部署。它立即返回相同的行为。
当我查看带有 heapster 标签的资源时,它看起来有点奇怪:
由于某种原因,有两个副本集。rs/heapster-867061013
即使我删除所有资源并重新部署它们,被调用的那个仍然会再次出现。上面还显示了 pod 刚刚启动,这是它不断创建的问题,然后它运行了几秒钟并创建了一个新的。我是运行 kubernetes 的新手,所以我不确定哪些日志文件与此问题相关。
来自 heapster 容器的日志
来自 heapster-nanny 容器的日志
kubernetes - 混合 CPU/内存资源和节点选择器失败
我有一个 ACS k8s Windows 集群设置和工作。早期我发现我需要使用 nodeSelector,否则即使我的容器镜像是 Windows,k8s 也会尝试将我的 pod 分配给主节点(Linux)。我用这个:
现在我正在尝试为我的 pod 分配内存和 cpu 资源,而 k8s 无法找到合适的节点。它显示了这个错误:
没有与以下所有谓词匹配的节点可用:内存不足 (2),MatchNodeSelector (1)
我有一个超小的资源分配,我的节点有足够的空间来处理这些:
这是完整的 k8s 部署 yaml:
如果我删除了 nodeSelector,那么 depoyment 会继续进行,但又会失败,因为 k8s 将它分配给了主节点。所以我被困住了。如何使用 nodeSelector 并分配资源?
azure-container-service - Accessing app specific logging/metrics data in Kubernetes cluster
I have a Python app running on a Kubernetes Cluster. I want to get app specific monitoring information e.g. logging info that I have in my app (using python logging module) and also metrics info that I am collecting using collectd. I understand Operations Management Suite can be used to monitor the cluster itself but can it also provide access to app specific logs and metrics?
Appreciate any pointers on how to do this.
Thanks Rajeev
azure - Azure 上的 Kubernetes nginx 入口控制器无法访问
我对 Azure、Kubernetes 甚至 Docker 本身都很陌生,并且正在使用该系统来学习和评估以后可能的部署。到目前为止,我已经对我的服务进行了 docker 化并成功部署了它们,并使用类型为 LoadBalancer 的服务使 Web 前端公开可见。
现在我想添加 TLS 终止,并了解到为此我应该配置一个入口控制器,其中最常提到的一个是 nginx-ingress-controller。
严格模仿示例,然后尝试阅读文档,我得到了一个看起来很有趣但不起作用的设置。也许某个好心人可以指出我的错误和/或给我指点如何调试它以及在哪里阅读更多关于它的信息。
我有 kubectl 应用了以下文件:
这给了我两个豆荚:
还有两项新服务。请注意,我还配置了 default-http-backend-service 类型:LoadBalancer,这仅用于调试。我已经包含了我的 web 前端,它被称为 webcms:
最后是一个入口:
没有我可以立即检测到的错误。然后我去了 Azure 仪表板并查看了负载均衡器及其规则,这对我(严重未经训练的)眼睛来说看起来不错。我没有碰这些,负载均衡器和规则是由系统创建的。这里有一个截图:
https://qvwx.de/tmp/azure-loadbalancer.png
但不幸的是,它不起作用。我可以卷曲我的 webcms 服务:
但是 default-http-backend 和 ingress 都不起作用:
(入口使用不同的 IP 给出相同的结果)
如果您读到这里:感谢您抽出宝贵时间,如果您能提供任何提示,我将不胜感激。
玛丽安
azure-container-service - 验证负载平衡 Azure 容器服务
我将 Azure 容器服务与 Kubernetes 编排器一起使用,并在具有 3 个节点的集群上部署了一个应用程序。它有5个副本。我如何验证负载平衡的实际效果,例如,我希望能够看到,每次我点击外部 IP 时,我都被路由到了不同的节点。谢谢。
kubernetes - 为 ACS 集群创建的两个资源组
我不明白为什么要为与 ACS 集群关联的所有基础架构创建单独的资源组,而不是我在创建集群时指定的资源组?这使我定义的资源组只有一个单独的实体(ACS 集群定义)和一个我无法控制其名称的全新资源组。不是这个的粉丝。
我目前正在使用 Azure CLI 创建我的 ACS 集群,所以我“猜测”如果我走 ARM 路线,我会有更多的控制权。不过,这种限制存在于哪里,为什么?
这是我的 CLI 命令:
最后我得到了两个资源组:
内部交流
内部-acs_int-madraskube_westus2
azure-container-service - 在 Azure 中从云创建 Docker Swarm 失败
每次从 docker cloud 创建 Docker Swarm 都会失败。
错误日志 docker Cloud: https ://gist.github.com/254813f30376c4ef1da20f320b29f815.git
错误日志 Azure 门户 https://i.imgur.com/LvBwauB.png
Azure 中的扩展错误日志: https ://gist.github.com/c95bc0e24129c43341d874397609f550.git
kubernetes - 面向 k8s 服务的公共 IP 在 ACS 中没有 DNS 名称
我创建了一个 k8s 服务,在我的 ACS Windows 集群中公开展示我的 WebApi pod。它运行良好,但没有与创建的公共 IP 资源关联的 DNS 名称。这禁止我将其添加为流量管理器配置文件的端点,障碍!
我可以手动为公共 IP 分配 DNS 名称,但随后我会触摸 ACS 创建的资源,这让我感到不舒服。但我真的想要一个静态 DNS 名称和 TrafficMgr 的功能在它前面。
这感觉像是一个严重的缺陷。有什么建议吗?
kubernetes - Windows 容器的外部 Internet DNS 解析失败
我有一个使用 k8s 的 ACS Windows 集群设置,通常运行良好。我已经部署了 ASP.NET Core webapi 和工作应用程序容器。这两个容器在本地运行良好,通常在 ACS 中也能正常运行。我可以扩展它们,部署新版本等。
它们正常工作,但在尝试访问外部 Internet 资源时突然开始生成 DNS 解析错误。我看到的例外情况包括:
System.Net.Http.WinHttpException:无法解析服务器名称或地址
他们试图访问的资源可以正常解析,然后突然停止解析。然后在一段不确定的时间后(几分钟、20 分钟,甚至似乎是几个小时),它们又开始消退,明显断断续续。请注意,这些外部资源是 CosmosDB、Azure 队列和名为 Loggly 的第 3 方日志服务(重点是它们都是大型 Web 属性,在这里没有错)。另请注意,两个容器不一定会同时丢失 DNS。
我试过在容器内打开一个命令外壳:
kubectl exec -it {podname} -- powershell
然后使用 powershell 请求一个站点:
调用-webrequest -uri www.google.com -outfile test.txt
获取内容 test.txt
...它工作正常,我可以访问 google.com。所以我不知道如何调试它。ACS 上的 k8s 是否存在可能在此处起作用的已知问题?
我已经将相同的容器部署到一个简单的 Server 2016 主机上,根本看不到问题。所以它似乎围绕着 k8s 或 ACS 集群本身。我已经在不同的区域(使用不同的 k8s 版本)重建了 ACS 集群 4 或 5 次,并看到完全相同的问题。
这对我来说是一个主要障碍。外部互联网访问显然是非常基本和核心的功能。没有它,我的 webapi 和 worker 应用程序就完全崩溃了。
azure - Azure Contianer 服务中 Kubernetes 集群的日志记录/监控
Azure 容器服务是否与 Azure Monitor 集成?想知道记录/监控 kubernetes 集群的最佳方法是什么?