在 AWS 上安装 Cloudera。尝试对其进行设置以使其具有多个命名队列,并且我可以使用 JDBC 连接到队列并执行查询。
从我目前所能收集到的信息来看,一旦队列在那里,使用 JDBC 连接到它们就相当简单,因为它只有以下格式:
http://<server name>:<port>/<queue name>
但是,目前还不清楚如何首先查看大量不同的文档来设置队列。似乎如果你有一个 hadoop-site.xml 文件,你进去并添加属性 mapred.queue.name 和一个逗号分隔的字符串。但 Cloudera 没有该文件。它确实有一个 mapred-site.xml,但添加该属性然后转到命令行并询问队列列表仍然只是返回默认值。
然后我们尝试使用 FairScheduler,但它是基于纱线的新调度器,它具有在命名队列之间平衡工作的概念。
所以我要找的是:
- 一种只创建 2 个队列的方法,例如工程和营销
- 表明一旦我拥有它们,我就可以使用 JDBC 连接到任何一个
- 并执行查询
之后,我可以担心使用 ACL 使队列对数据的不同部分具有不同的访问权限,并可能管理对资源的访问。现在,只是想表明我可以获取通过命名队列公开的数据。