0

我正在尝试编写一个可以被来自 Sql 背景的人轻松使用的包装器。我还没有开始这项工作,我想知道我应该采取什么方法。

这是问题陈述 - 如果有人在他们的 rdbms 数据上编写了很多本机 Sql,并且他们想切换到 hadoop,那么就会有很多问题。Hive 消除了在 hdfs 中构建表的一个主要问题。现在是查询部分——为此我们有不同的框架,但没有一个框架本身是完整的——比如一个可能很慢,而另一个可能缺乏功能。例如,有 Impala,有 Hive QL,但对于最终用户来说,没有 ONE 框架。我打算做这样的事情 - select(comma-separated string of column names, tableName).where(filter-expression)....

像用于 hdfs 的 Linq 之类的东西,它会找出执行 select(hive ql 或 Impala)的最佳方法,执行 where 子句的最佳方法等。

建议?想法?批判?

谢谢

4

1 回答 1

1

为什么不使用Impala的ODBCJDBC驱动程序?MicroStrategy 或 Tableau 等第三方工具使用这些驱动程序向 Impala 提交查询。

于 2013-04-22T06:59:01.603 回答