使用 Impala 运行 CDH4 集群,我创建了 parquet 表,并将parquet jar 文件添加到 hive 后,我可以使用 hive 查询表。
向 /opt/presto/lib 添加了相同的 jar 集,并重新启动了协调器和工作器。
parquet-avro-1.2.4.jar
parquet-cascading-1.2.4.jar
parquet-column-1.2.4.jar
parquet-common-1.2.4.jar
parquet-encoding-1.2.4.jar
parquet-format-1.0.0.jar
parquet-generator-1.2.4.jar
parquet-hadoop-1.2.4.jar
parquet-hive-1.2.4.jar
parquet-pig-1.2.4.jar
parquet-scrooge-1.2.4.jar
parquet-test-hadoop2-1.2.4.jar
parquet-thrift-1.2.4.jar
从 Presto 运行 parquet 选择查询时仍然出现此错误:
> select * from test_pq limit 2;
Query 20131116_144258_00002_d3sbt failed : org/apache/hadoop/hive/serde2/SerDe