hadoop - Hive QL / UDF / Impala 查询的包装器

Question

我正在尝试编写一个可以被来自 Sql 背景的人轻松使用的包装器。我还没有开始这项工作，我想知道我应该采取什么方法。

这是问题陈述 - 如果有人在他们的 rdbms 数据上编写了很多本机 Sql，并且他们想切换到 hadoop，那么就会有很多问题。Hive 消除了在 hdfs 中构建表的一个主要问题。现在是查询部分——为此我们有不同的框架，但没有一个框架本身是完整的——比如一个可能很慢，而另一个可能缺乏功能。例如，有 Impala，有 Hive QL，但对于最终用户来说，没有 ONE 框架。我打算做这样的事情 - select(comma-separated string of column names, tableName).where(filter-expression)....

像用于 hdfs 的 Linq 之类的东西，它会找出执行 select（hive ql 或 Impala）的最佳方法，执行 where 子句的最佳方法等。

建议？想法？批判？

谢谢

score 1 · Accepted Answer

为什么不使用Impala的ODBC或JDBC驱动程序？MicroStrategy 或 Tableau 等第三方工具使用这些驱动程序向 Impala 提交查询。

hadoop - Hive QL / UDF / Impala 查询的包装器

1 回答 1

Related

Reference