问题标签 [dcos]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - 从运行在 Mesos DCOS 集群中的应用程序提交 Spark
我有一个在 AWS 上运行的 Mesos DCOS 集群,通过dcos package install spark
命令安装了 Spark。我能够使用 DCOS CLI 成功执行 Spark 作业:dcos spark run ...
现在我想从在 Mesos 集群内运行的 Docker 容器执行 Spark 作业,但我不太确定如何访问正在运行的 spark 实例。想法是让 docker 容器执行spark-submit
命令以将作业提交到 Spark 部署,而不是使用 DCOS CLI 从集群外部执行相同的作业。
当前文档似乎只关注通过 DCOS CLI 运行 Spark - 有没有办法从集群内运行的另一个应用程序访问 spark 部署?
spray - 所有 spray.io 容器的 marathon-lb 健康检查失败
我正在使用 marathon-lb 运行 DC/OS 1.7。
spray.io 1.3.3 向所有 marathon-lb/HAProxy 健康检查调用返回 400:request has a relative URI and is missing a Host header
因此 marathon-lb 永远不会将任何请求路由到服务。
马拉松 json 中的健康检查是:
docker容器中spray.io的日志记录是:
[警告] [08/19/2016 23:53:42.534] [asp-service-akka.actor.default-dispatcher-5] [akka://asp-service/user/IO-HTTP/listener-0/4 ] 非法请求,以状态“400 Bad Request”响应:非法请求:无法建立 HttpRequest(GET,/health,List(),Empty,HTTP/1.0) 的有效请求 URI,请求具有相对 URI,并且缺少
Host
标头
/health
端点可以从 curl 对 mesos 管理的 ip:port 正常工作。
我找不到任何关于通过 marathon-lb 使 HAProxy 更宽容或抑制 spray.io 的 400 的文档。
package - dcos 将软件包安装到本地 Universe
我有一个运行“宇宙”本地实例的 DC/OS 集群。将自定义包添加到本地“宇宙”的具体程序是什么?到目前为止,我发现的唯一文档(非常有限)与将包添加到全局 Universe 存储库有关。虽然这对 DC/OS 社区来说非常有用,但在维护私有 Universe 和存储库方面却无济于事。
我发现的唯一程序说:
1-创建公共宇宙回购的一个分支:https ://github.com/mesosphere/universe
2-创建自定义包,然后将其重新提交回社区。
这并不完全是我期望看到的。我希望有一个简单的本地包创建过程。有这样的事吗?
谢谢,
高途
arangodb - DCOS 无法安装和运行 ArangoDB
我已经安装了具有一个代理和 3 个主服务器的 DCOS,并尝试安装 ArangoDB,但无法部署 arangodb。
以下是根据日志看到的配置。
ArangoDB 图片:arangodb/arangodb-mesos:3.0
模式:集群
异步复制标志:0
SecondaryWithDBservers: 0
CoordinatorsWithDBservers: 0
次要服务器:0
ArangoDBForcePullImage:1
ArangoDBPrivilegedImage: 0
最小资源代理:mem( ):2048;cpus( ):0.25;disk(*):2048
最小资源 DBserver:mem( ):4096;cpus( ):1;disk(*):4096
最小资源辅助DBserver:mem( ):4096;cpus( ):1;disk(*):4096
最小资源协调器:mem( ):4096;cpus( ):1;disk(*):1024
代理人数:3人
数据库服务器数量:2
协调员人数:2
动物园管理员:zk://master.mesos:2181/arangodb3
以下是日志文件中看到的错误。
0901 07:07:34.769537 23 CaretakerCluster.cpp:422] 计划代理实例:3,运行代理实例:1
I0901 07:07:34.769601 23 Caretaker.cpp:400] 报价下降 e2301ebe-fff0-46a5-b71b-ef77b9a7a764-O11
I0901 07:07:37.474743 24 HttpServer.cpp:439] 处理 http 请求 'GET /v1/health.json'
I0901 07:07:40.802276 23 CaretakerCluster.cpp:416] 这里提供:
{"id":{"value":"e2301ebe-fff0-46a5-b71b-ef77b9a7a764-O12"},"framework_id":{"value":"37ac79b8-bc37-4493-9558-aa72638290db-0002"}," slave_id":{"value":"37ac79b8-bc37-4493-9558-aa72638290db-S0"},"hostname":"192.168.12.167","url":{"scheme":"http","address": {"hostname":"192.168.12.167","ip":"192.168.12.167","port":5051},"path":"/slave(1)","query":[]},"resources ":[{"name":"ports","type":1,"ranges":{"range":[{"begin":1026,"end":2180},{"begin":2182,"结束“:3887},{“开始”:3889,“结束”:5049},{“开始”:5052,"end":8079},{"begin":8082,"end":8180},{"begin":8182,"end":17140},{"begin":17144,"end":32000} ]},"role":" "},{"name":"disk","type":0,"scalar":{"value":1.17866e+06},"role":" "},{ "name":"cpus","type":0,"scalar":{"value":7.5},"role":" "},{"name":"mem","type":0,"标量":{"值":12298},"角色":"磁盘","type":0,"scalar":{"value":1.17866e+06},"role":" "},{"name":"cpus","type":0,"scalar" :{"value":7.5},"role":" "},{"name":"mem","type":0,"scalar":{"value":12298},"role":"磁盘","type":0,"scalar":{"value":1.17866e+06},"role":" "},{"name":"cpus","type":0,"scalar" :{"value":7.5},"role":" "},{"name":"mem","type":0,"scalar":{"value":12298},"role":""}],"属性":[],"executor_ids":[]}
I0901 07:07:40.802320 23 CaretakerCluster.cpp:422] 计划代理实例:3,运行代理实例:1
I0901 07:07:40.802383 23 Caretaker.cpp:400] 报价下降 e2301ebe-fff0-46a5-b71b-ef77b9a7a764-O12
我相信一台代理服务器也足够了。是不是代理的数量也应该是3台服务器?
如果需要,还需要知道如何重新启动整个集群和单个服务?(杀死进程似乎不是正确的方法)
有人可以建议这里究竟需要做什么......
提前致谢!
mesos - Ansible DC/OS 部署
我刚刚编写了一个使用 CloudFormation 模板部署 DC/OS 的 Ansible 剧本,如下所示:
https
://docs.mesosphere.com/1.8/administration/installing/cloud/aws/
它工作正常!
现在我正在尝试使用 Ansible 在 DC/OS 上连接以在其上部署东西,但当然我需要先登录。
我知道创建第一个帐户的方法是使用浏览器访问 DC/OS 页面。
但是我想以编程方式为 Ansible 创建第一个帐户,我该怎么做?
干杯
marathon - DC/OS - 身份验证与 api 令牌
据我所知,DC/OS 有两种不同类型的令牌:
身份验证令牌:通过 https://public-master-ip/login?redirect_uri=urn:ietf:wg:oauth:2.0:oob登录检索。此令牌用于检索 api 令牌。
api 令牌:通过使用请求正文中的身份验证令牌对https://public-master-ip/acs/api/v1/auth/login的 post 调用检索。此令牌用于授权对 api 的调用。这样的令牌将在 5 天后过期。
我的问题是
- 我的假设正确吗?
- 身份验证令牌是否过期?如果是这样,何时以及有没有办法刷新它?
apache-kafka - 使用在 mesos DCOS 上运行的 kafka 发布消息时出现问题
我有一个运行 DCOS 的小型集群。我能够按照本指南成功安装 kafka。跑步
给
我可以创建主题,并且我已经使用 cli 工具检查了 zookeeper 并且状态似乎很好
但是,当我尝试发布时
我明白了
我怀疑这可能与私有 IP 地址与公共 IP 地址有关,也可能与 server.properties 中的 host.name 有关。
任何人都可以就我如何调试(并希望解决!)问题提供一些建议,以便我可以成功发布消息?
谢谢
阿杰
docker - DC/OS 软件包不存在
我在 DC/OS 存储库中添加了两个存储库。
- https://github.com/mesosphere/multiverse/archive/version-1.x.zip
- https://universe.mesosphere.com/repo
但是我的Universe Packages页面中没有显示任何内容!我收到以下错误:
undefined 您可以进入存储库设置页面来更改已安装的存储库。
我可以在哪里看到更多相关的错误消息(journalctl 除外)
我的 DCOS 版本是 1.8.4,我也有 VPN 连接。
dcos - 无法在 Mac OSX 上安装 dcos-cli
DCOS提供如下安装命令安装cli工具:
但是,当我在我的 Mac 上运行它时,它会失败并显示以下内容:
当我在 Ubuntu 上运行相同的命令时,它工作得很好。知道根本原因是什么吗?
vagrant - 如何让 DC/OS 查看 Universe 存储库
我正在尝试让 DCOS 与 Vagrant 1.8.4 和 VirtualBox 一起运行。DCOS 出现,我可以进入仪表板,但我看不到“Universe”存储库。运行 DC/OS Vagrant 的计算机位于代理后面,因此我按照此处的说明进行操作,但仍然看到以下错误:
主节点可以到达外部世界,特别是我可以(vagrant) ssh 进入主节点并成功 ping 代理外部的机器。
最后,作为替代方案,我尝试下载并设置本地存储库,但遇到了一个已知问题。
有人问了一个类似的问题(作为一个 stackoverflow 初学者,我已经用尽了我的链接预算)当有两个 repos 时很难找到 Universe,但这似乎不适用于我面临的问题。
任何意见,将不胜感激。感谢您的时间。
作为附录,这里有一些来自最近测试的更多信息:在我的主机笔记本电脑(A Mac)上,我可以 ping google.com 和 mesosphere.com。但是,当我 vagrant ssh 进入主节点时,我可以 ping google.com,但是当我尝试 ping mesosphere.com 时,我看到了错误:
我天真地假设由于 Universe 回购位于 Universe.mesosphere.com,我需要解析 mesosphere.com。