1

我在 Amazon EC2 中设置的 hadoop 集群 (HDP 2.2) 中遇到了一个非常奇怪的问题(3 个数据节点 + 一个名称节点 + 一个辅助名称节点)。Hue 服务器在主名称节点上运行,hive 服务器在辅助名称节点上运行。我正在使用 Hue Web 界面使用加载到 HDFS 中的 CSV 文件在 HCatalog 中创建表“mytable”。表创建成功返回,没有错误。该表已创建并显示在 Hue Web 界面中。但是,当我尝试查询该表时,它返回了 0 条记录。我去了 /app/hive/warehouse 文件夹,我可以看到表文件夹“mytable”已创建,但 CSV 文件从未复制到该文件夹​​中。我使用 hive shell 重现了相同的行为。

如果我在 HDP 沙盒 VM 中执行相同的操作,一切都会按预期工作。创建表后,/app/hive/warehouse/mytable 文件夹包含我导入到表中的 CSV 文件。

非常感谢任何帮助。

4

1 回答 1

1

我解决了这个问题。我意识到集群中运行 hive 服务器的服务器的物理内存不足。释放盒子上的一些内存后,hcatalog 表创建操作按预期工作。

于 2015-02-10T04:59:30.523 回答