hadoop - HCatalog/Hive 表创建不会将数据导入 hadoop 集群中的 /app/hive/warehouse 文件夹

Question

我在 Amazon EC2 中设置的 hadoop 集群 (HDP 2.2) 中遇到了一个非常奇怪的问题（3 个数据节点 + 一个名称节点 + 一个辅助名称节点）。Hue 服务器在主名称节点上运行，hive 服务器在辅助名称节点上运行。我正在使用 Hue Web 界面使用加载到 HDFS 中的 CSV 文件在 HCatalog 中创建表“mytable”。表创建成功返回，没有错误。该表已创建并显示在 Hue Web 界面中。但是，当我尝试查询该表时，它返回了 0 条记录。我去了 /app/hive/warehouse 文件夹，我可以看到表文件夹“mytable”已创建，但 CSV 文件从未复制到该文件夹中。我使用 hive shell 重现了相同的行为。

如果我在 HDP 沙盒 VM 中执行相同的操作，一切都会按预期工作。创建表后，/app/hive/warehouse/mytable 文件夹包含我导入到表中的 CSV 文件。

非常感谢任何帮助。

score 1 · Accepted Answer

我解决了这个问题。我意识到集群中运行 hive 服务器的服务器的物理内存不足。释放盒子上的一些内存后，hcatalog 表创建操作按预期工作。

hadoop - HCatalog/Hive 表创建不会将数据导入 hadoop 集群中的 /app/hive/warehouse 文件夹

1 回答 1

Related

Reference