“apache-drill”的相关标签问题

0 投票

2 回答

131 浏览

sql - Apache Drill 可以解析 SQL 语句以获取表名吗？

我在 Eclipse 中有一个现有的 Java 项目，我希望能够解析用户输入的 SQL 语句，以便在语句中找到表名。Apache Drill 是否有可能完成这项任务，如果可以，我该怎么做？

我一直在查看 Drill 的文档，但我只能找到一种在 Eclipse 中创建函数的方法，这些函数以后可以在命令提示符中使用。但是，我想要的是一种在 Java 项目中使用某种解析函数来查找用户输入中的表名的方法。

2015-08-11T23:25:04.397

0 投票

1 回答

256 浏览

apache-drill - 在 apache-drill 中使用 bootstrap-storage-plugins.json 文件作为存储插件的异常

我想为MongoDBin添加存储插件apache-drill。阅读文档后，我开始知道以编程方式我可以通过两种方式做到这一点：

休息 API
使用 bootstrap-storage-plugins.json 进行配置

我正在为我的java代码使用第二种方式。

我的代码的有用部分：

引导存储插件.json：

但在射击

我得到以下异常：

org.apache.calcite.sql.validate.SqlValidatorException 严重：org.apache.calcite.sql.validate.SqlValidatorException：找不到表'mongo.testDB.testCollection' 2015 年 8 月 12 日凌晨 3:47:05 org.apache.calcite .runtime.CalciteException 严重：org.apache.calcite.runtime.CalciteContextException：从第 1 行第 15 列到第 1 行第 19 列：找不到表 'mongo.testDB.testCollection' java.sql.SQLException：解析错误：从行1，第 15 列到第 1 行，第 19 列：找不到表 'mongo.testDB.testCollection'

bootstrap-storage-plugins.json在我的类路径中。我需要提供其他信息吗？

编辑：

我尝试show databases了查询，但它没有显示来自MongoDB. 它只显示：

apache-drill

2015-08-12T10:42:04.347

0 投票

1 回答

623 浏览

hadoop - Mapreduce Vs Spark Vs Storm Vs Drill - 适用于小文件

我知道 spark 进行内存计算并且比 MapReduce 快得多。我想知道 spark 对于记录 < 10000 的效果如何？我有大量文件（每个文件有大约 10000 条记录，比如 100 列文件）进入我的 hadoop 数据平台，我需要在加载到 hbase 之前执行一些数据质量检查。

我在后端使用 MapReduce 的 hive 中进行数据质量检查。每个文件大约需要 8 分钟，这对我来说非常糟糕。火花会给我更好的表现让我说2-3分钟吗？

我知道我必须做一个板凳标记，但在我真正开始使用 spark 之前，我试图了解这里的基础知识。我记得第一次创建 RDD 将是一项开销，因为我必须为每个传入的文件创建一个新的 RDD，这将花费我一点。

我很困惑哪一个对我来说是最好的方法——火花、钻头、风暴或 Mapreduce 本身？

hadoop apache-spark hive apache-storm apache-drill

2015-08-15T18:58:47.220

0 投票

1 回答

132 浏览

business-intelligence - 使用 Apache Drill 访问 Progress DB 的指针

Progress/OpenEdge 不是 SQL 数据库，虽然它支持 SQL（通过 ODBC 接口），但它不是访问 OpenEdge 数据的自然方式。Progress 应用程序是使用“ABL”（以前称为“Progress 4gl”）构建的，并且一些 SQLish 事物（如参照完整性约束）是通过 4gl 代码中的过程逻辑实现的。如果你对学习 ABL 不是很感兴趣，这会让事情变得很困难。

有没有人成功地使用 Apache Drill ( https://drill.apache.org ) 来访问进度数据？是否有任何特别针对 Progress 和 Apache Drill 组合的指针可以分享？

business-intelligence progress-4gl openedge progress-db apache-drill

2015-08-16T10:48:35.043

0 投票

1 回答

376 浏览

tomcat - 将 apache Drill 导入 Eclipse 或 IntelliJ

我现在正在学习 apache Drill，并且想做一些调试。现在，每次更改后，我都需要重新编译整个项目。所以我只想知道，我可以将整个apache钻项目导入eclipse或IntelliJ吗？如何？我知道钻孔项目包含一些模板 java 文件，在编译时会生成许多类，在导入到 eclipse/IntelliJ 后，这还能工作吗？

tomcat intellij-idea apache-drill

2015-08-19T02:48:22.543

0 投票

1 回答

322 浏览

sql - 带有结果的 Apache Drill mash 文件元数据

我目前对 Apache Drill 的查询如下 -

我想要做的是获取我文件夹中每个 .csv 文件的 modifyTime 元数据作为这样的列 -

运行以下命令时可以找到 modifyTime 元数据

有没有办法在其当前版本 1.1 或 1.0 中实现这一点？

更新 1

我真正要寻找的是针对单个文件的 select 语句的结果集中包含的文件元数据

如果我的目录结构如下 -

我想写的查询类型 -

预期结果 -

sql apache apache-drill nosql

2015-08-19T11:34:11.000

0 投票

1 回答

172 浏览

apache - 在从 Drill 查询 HDFS 时需要帮助

我的笔记本电脑上安装了钻头和动物园管理员。我在笔记本电脑上启动了 HDFS，发现可以查询 HDFS 中的 csv 和 json 文件。现在我想查询位于另一台笔记本电脑中的文件。因此，我在另一台笔记本电脑上启动了 hdfs，当我给出 select * 查询时，它失败了（尽管我可以show files毫无问题地执行查询）。

我得到的错误在保管箱链接中：

https://www.dropbox.com/s/5bgyw4jetweczoj/drill.log?dl=0

两台运行 Ubuntu 的笔记本电脑

阿帕奇钻版本：1.1.0

我有以下问题：

1）是否可以在hadoop集群外的机器上运行drill并查询集群中的hdfs文件？

2）如果是，是否需要额外的配置更改？

apache hadoop hdfs apache-drill

2015-08-20T11:20:32.083

0 投票

1 回答

522 浏览

mysql - 如何使用 Apache Drill 同时处理 Excel 文档和 RDBMS 中的源代码？

我有一个 RDBMS，它是 MySQL 和几个 Excel 文件。

我需要查询 RDBMS 和 Excel 文件，我遇到了 Apache Drill。

我了解 Apache Drill 允许我在 Excel 等无模式数据源上构建 ANSI SQL 查询。

问题，如果我需要同时查询Excel文件和RDBMS数据源怎么办？

我可以使用 Apache Drill 吗？

如果没有，我能用什么？

如果我更喜欢使用 Apache Drill，那么我必须采取哪些变通方法才能让 Apache Drill 与 RDBMS 一起工作？

mysql excel apache-drill

2015-08-21T11:26:08.923

0 投票

1 回答

130 浏览

hadoop - Apache Drill 如何在 Hive 之上工作？

Apache Drill 如何在 Hive 之上工作？它是执行 MapReduce 来查询，还是类似于 Tez 的工作方式？谢谢。

hadoop hive apache-drill

2015-08-22T05:08:45.783

0 投票

2 回答

5096 浏览

hadoop - Apache Drill的性能

是否有任何性能基准（真正的）可以比较 Stinger、Impala 和 Drill？此外，这是首选 - 我的用例将主要针对 Hive 之上的临时交互式查询。谢谢。

hadoop hive impala apache-drill apache-tez

2015-08-22T06:44:37.843

问题标签 [apache-drill]

Reference