Hiveserver2 无法读取 HDFS 数据。我已经在 HDFS 之上构建了表格。
这些是我试图解决问题的表属性,它们都不能在 HDP 3.x 中完美运行
尝试了内部和外部表
存储为 ORC
777权限递归所有文件夹
以表的相同所有者身份执行表
跨国真实(仅限内部表)
兽人压缩zlib
Msck 修复成功执行。显示分区值和文件夹大小与 prod 中相同
分区和分桶
CREATE EXTERNAL TABLE `machine_data`(`ids` string,`delta`
string,`locatio` string,`time_data` string,`valid` boolean,`measure`
string,`val` float
)
PARTITIONED BY (`nodename` string)
CLUSTERED BY (delta) INTO 53 BUCKETS
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
;
我已将数据从服务器 A 移动到服务器 B,将服务器 C 移动到 HDFS,并在 HDFS 数据之上构建了一个表。所有三台服务器都在 HDP 3.1 中。服务器 A 它是生产服务器,从初始设置开始运行良好。将数据分别移动到开发和测试服务器。
服务器 B 是测试服务器,第二天似乎没有任何变化。
服务器 C 是开发服务器三天后根本不工作。
比较 HS2 配置。跨服务器几乎相同
处理这种类型的场景真的很奇怪。