问题标签 [apache-drill]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1643 浏览

google-cloud-storage - 使用谷歌云存储的 Apache Drill

Apache Drill 功能列表提到它可以从 Google Cloud Storage 查询数据,但我找不到任何关于如何做到这一点的信息。我已经让它在 S3 上运行良好,但怀疑我在谷歌云存储方面遗漏了一些非常简单的东西。

有人有谷歌云存储的示例存储插件配置吗?

谢谢

0 投票
1 回答
1660 浏览

java - 启动 Apache Drill 时无法找到或加载主类 sqlline.SqlLine 错误

我是 Apache Drill 的新手。我有 java 版本 1.7.0_79。我的 Hadoop-1.2.1 安装是 Ubuntu-14.04 上的伪分布式单节点设置。我已经下载了 Drill-1.1.0。来自官网。我解压缩了 tar 球并将其路径设置在 .bashrc 文件中。我开始使用Drill bin/drillbit.sh start,它说starting drillbit, logging to /usr/lib/drill/log/drillbit.out。但是当我使用 来检查它的状态时bin/drillbit.sh status,它说/usr/lib/drill/drillbit.pid file is present but drillbit not running.我错过了配置 Drill 的任何步骤吗?

当我运行bin/sqlline -u jdbc:drill:zk=local命令启动钻壳时,它显示以下错误:

为什么钻头不运行?如何纠正这个错误并开始使用 Drill shell?

0 投票
2 回答
851 浏览

sql - 如何在 Apache Drill 中加入不等式?

我正在尝试在 Drill 中运行一个需要不等式连接的查询(例如'on a.event_time >= b.event_time and a.event_time < b.next_event_time')。我收到了 Drill 不支持不等式连接的错误,这也是我在网上阅读的内容。

在不使用不等式连接的情况下,是否有任何变通方法可以在钻取中使用以获得相同的结果?我能想到的只是扩展我的一个表,以包含我尝试加入的字段的每次迭代的重复行,但我猜有一种更直接的方式,Drill 用户可以解决这个问题。

0 投票
2 回答
400 浏览

jmeter - 用于负载测试大数据中各种 SQL 替代方案的工具

我们正在努力确定 Impala、Drill、Spark-SQL 中哪种 SQL 替代方案适合我们的用例。作为其中的一部分,我们需要对它们进行负载测试,我们是否有任何负载测试工具?我知道 Apache 有 J Meter。

另外,我们在 MApR Distribution 中是否有任何类似于 Cloudera Manager 的工具?

0 投票
2 回答
1752 浏览

apache-drill - Apache Drill 中的 JOIN 查询问题

存储在 Hive 中的文件:

hadoop 中的 CSV 文件:

我单独询问了他们,​​它工作正常。然后,我尝试加入查询:

我遇到了以下问题:

org.apache.drill.common.exceptions.UserRemoteException:系统错误:DrillRuntimeException:联接仅支持 1. 数字数据 2. Varchar、Varbinary 数据 3. 日期、时间戳数据之间的隐式转换 左类型:INT,右类型:VARCHAR。添加显式强制转换以避免此错误 Fragment 0:0 [Error Id: b01db9c8-fb35-4ef8-a1c0-31b68ff7ae8d on IMPETUS-DSRV03.IMPETUS.CO.IN:31010]

0 投票
0 回答
782 浏览

apache-drill - 如何在 Apache Drill 中查询整个 S3 目录?

我正在尝试查询 S3 中包含镶木地板文件的整个目录。查询挂起一段时间,然后返回错误:

data运行这些命令时,我可以看到我的文件夹:

谢谢!

0 投票
1 回答
136 浏览

jdbc - 通过 JDBC 连接 Apache Drill 与 OpenOffice/LibreOffice

我正在尝试通过 JDBC 接口将LibreOffice用作Drill DB引擎的前端。目前我在嵌入式模式下工作,然后我将切换到分布式模式。Drill 在 CLI 或 GUI 界面中运行良好。我正在使用Oracle JRE 1.7 我已经注册了 Java 类org.apache.drill.jdbc.Driver,并且正确找到了它。但是一旦我尝试连接,答案总是

“java.lang.NullPointerException”。
“引用处理程序”守护进程 prio=10 tid=0x00007fc64c140800 nid=0x916 in Object.wait() [0x00007fc63f2f1000] java.lang.Thread.State: WAITING (on object monitor) at java.lang.Object.wait(Native Method) -在 java.lang.ref.Reference$ReferenceHandler.run(Reference.java:133) 的 java.lang.Object.wait(Object.java:503) 等待 <0x00000000d7704470> (a java.lang.ref.Reference$Lock) ) - 锁定 <0x00000000d7704470> (a java.lang.ref.Reference$Lock)
“VM 线程”prio=10 tid=0x00007fc64c13c000 nid=0x915 可运行“GC 任务线程#0 (ParallelGC)”prio=10 tid=0x00007fc64c02b000 nid=0x911 可运行“GC 任务线程#1 (ParallelGC)”prio=10 tid=0x00007fc64c02000 nid=0x912 可运行的“GC 任务线程#2 (ParallelGC)”prio=10 tid=0x00007fc64c02f000 nid=0x913 可运行的“GC 任务线程#3 (ParallelGC)”prio=10 tid=0x00007fc64c030800 nid=0x914 可运行的“VM 周期性任务线程” prio=10 tid=0x00007fc64c17c800 nid=0x91d 等待条件 JNI 全局引用:145

相同的 JDBC 接口似乎可以在 Squirrel 中工作,并且可以正确打开。

有人设法解决了吗?非常感谢您的帮助。

让我添加一些线索(感谢马克,感谢吉姆)。我只是将 LibreOffice Base 用作应用程序,因为它来自 Ubuntu Desktop。这里有一些细节:
LibreOffice:版本:4.2.8.2 构建 ID:420m0(构建:2)

riccardo@coccodrill:~$ java -version java version "1.7.0_80" Java(TM) SE Runtime Environment (build 1.7.0_80-b15) Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)

riccardo@coccodrill:~$ uname -a Linux coccodrill 3.19.0-30-generic #34~14.04.1-Ubuntu SMP Fri Oct 2 22:09:39 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux

马克,对不起,我不知道如何检索 NullPointer 异常的堆栈跟踪,因为我不是在编写应用程序,所以我周围没有开发环境。我想有点盲目地工作。

0 投票
2 回答
1436 浏览

apache-drill - 无法使用 Apache Drill 查询 RDBMS

使用 apache Drill 1.2,我们可以查询 RDBMS 数据。在此处查看更多信息:https ://drill.apache.org/blog/2015/10/16/drill-1.2-released/

所以,我尝试为 MySQL 添加一个插件。我正在使用网络客户端进行操作。我创建了一个带有名称的插件mysql并添加了以下配置:

另外,我添加mysql.jar/apache-drill-1.2.0/jars/3rdparty

它显示错误:

(无效的 JSON 映射)

任何关于此的指针。有任何文件吗?

0 投票
1 回答
135 浏览

apache-drill - 如何使用具有不同于默认扩展名的文件扩展名的钻嵌入?

我正在尝试通过 Drill-embed 测试 apache Drill,但我所有的 json 文件都是带有 jl.gz 文件扩展名的 jsonline 文件。

如果我将它们重命名为 json.gz 它可以工作,但在我的情况下这是不可取的。

我怎么能告诉钻 jl.gz 文件实际上是 json?

PS:我尝试将 a 添加bootstrap-storage-plugins.json到 $CP 但钻嵌入似乎没有读取它。

0 投票
1 回答
134 浏览

apache-drill - 在 Drill-Hive 的情况下不进行动态模式发现

我正在使用带钻的蜂巢。

存储插件信息:

它对查询和所有工作都很好。

然后我想检查它是否会自动发现 hive 中新创建的表。

我开始以嵌入式模式进行钻取,并在配置单元中使用了一个特定的数据库

testDB是 Hive 中带有表t1&的数据库t2。然后我问:

它给了我表名

我在 hive 中创建了一个表,然后在 Drill 中t3再次触发。show tables;它还在显示 t1 t2。5-10 分钟后,我再次开火 show tables;,它正在显示t1 t2 t3

我认为它应该t3在添加t3蜂巢后立即显示。

这种行为可能是什么原因以及钻头如何在内部处理它?