0

Hiveserver2 无法读取 HDFS 数据。我已经在 HDFS 之上构建了表格。

这些是我试图解决问题的表属性,它们都不能在 HDP 3.x 中完美运行

  1. 尝试了内部和外部表

  2. 存储为 ORC

  3. 777权限递归所有文件夹

  4. 以表的相同所有者身份执行表

  5. 跨国真实(仅限内部表)

  6. 兽人压缩zlib

  7. Msck 修复成功执行。显示分区值和文件夹大小与 prod 中相同

  8. 分区和分桶

CREATE EXTERNAL TABLE `machine_data`(`ids` string,`delta` string,`locatio` string,`time_data` string,`valid` boolean,`measure` string,`val` float ) PARTITIONED BY (`nodename` string) CLUSTERED BY (delta) INTO 53 BUCKETS ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat' ;

我已将数据从服务器 A 移动到服务器 B,将服务器 C 移动到 HDFS,并在 HDFS 数据之上构建了一个表。所有三台服务器都在 HDP 3.1 中。服务器 A 它是生产服务器,从初始设置开始运行良好。将数据分别移动到开发和测试服务器。

服务器 B 是测试服务器,第二天似乎没有任何变化。

服务器 C 是开发服务器三天后根本不工作。

比较 HS2 配置。跨服务器几乎相同

处理这种类型的场景真的很奇怪。

4

0 回答 0