我有一个小型 hadoop/hive 集群(总共 6 个节点)。使用“hadoop dfsadmin -report”我看到数据节点运行良好且已连接。此外,当我在配置单元表中添加数据时,我可以看到数据分布在整个节点上。(易于检查,随着使用的磁盘空间增加)。
我正在尝试在一张表上创建一些索引。从 jobtracker http 界面,我看到只有一个节点可用。我尝试运行多个查询(我使用 mysql 作为元数据),但它们似乎只在安装了 hive 的节点上运行。
基本上我的问题是如何让 jobtracker 也能利用其他节点。