问题标签 [apache-drill]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1132 浏览

apache-drill - 如何快速启动 apache 钻取并对 csv 文件执行查询?

我已经设法在 ubuntu 14.04 无头虚拟机上安装了 apache Drill。

我已经放置了一个我想要对其执行查询的 csv 文件。

我阅读了教程,但当我只想快速入门时,这些教程对我来说毫无意义。

得到它来安装。 怎么办?

请指教。

0 投票
1 回答
2271 浏览

apache-camel - 将 HL7 v2 转换为 JSON

我希望将 HL7 v2(较旧的 EDI 格式)消息转换为 JSON,因此我可以使它们在 Apache Drill 下可处理并在 Parquet 下可压缩。

我调查了HAPI,但我没有找到用于非 XML HL7 到 JSON 转换的实用程序。

有人对图书馆有建议或参考吗?

0 投票
1 回答
266 浏览

cassandra-2.0 - 如何在嵌入式模式下将 apache-drill 与 cassandra 连接

我想将钻与 cassandra 连接起来。我找到了一个博客,但是当我按照该博客的说明进行操作时出现错误。有谁知道如何连接两者?

0 投票
1 回答
122 浏览

apache-drill - 使用 Apache Drill 查询嵌入式 json 时出错

donutTest.json (在我的本地系统 /home/dev 中):

此查询工作正常。

但是当我尝试时:

它显示错误。

找不到表“击球手”

topping[0]并且batter两者都是嵌入式文档仍然错误。

0 投票
1 回答
120 浏览

apache-drill - Dremel 或其实现(例如 Drill)如何处理内存中的大型列式数据布局?

我正在阅读 Google Dremel 的白皮书。我知道它将复杂数据转换为列式数据布局

这些数据存储在什么位置?

由于 Drill 没有中央元数据存储库,我假设它必须是in-memory

因此,当我有数十亿行时,Drill 如何处理这些数据?

0 投票
2 回答
339 浏览

json - 使用 Apache Drill 搜索 Firebase JSON

我从https://domain.firebaseio.com/users/导出了部分数据

执行:SELECT * FROM dfs。/Users/me/Desktop/users.json

有效(或者,至少我得到了结果) 在此处输入图像描述

但是如何将列映射为行中的值。从关系数据库世界来看,屏幕截图中的列标题是唯一的 ID (3, 4) - 这些应该是行的一部分,而不是列标题。使用 push({}) 时生成的唯一生成的密钥也是如此

目标当然是做一个 Select Where (select * from data where fullname="Mario Test") 例如

在使用 Drill 搜索 JSON 之前,我应该对它进行某种预处理吗?

0 投票
1 回答
647 浏览

parquet - apache钻内存异常

我正在尝试在单节点设置中使用 apache Drill 将超过 600gb 的 csv 文件重新格式化为镶木地板。

我运行我的 sql 语句:

它正在创建镶木地板文件,但出现错误:

有没有解决的办法?还是有其他方法可以进行转换?

0 投票
1 回答
223 浏览

scala - 使用 Kryo 序列化的 Apache Drill 查询数据

我通过使用Kryocom.twitter.chill . _ _ _ KryoInjection)。

现在我想用Apache Drill查询这些数据,并将它从序列化的字节数组转换为人类可读的东西。

我想我会以某种方式在Apache Drill中“注册”我自己的转换器并将其提供给钻取查询。

不幸的是,我无法找到有关是否以及如何完成的任何信息。

0 投票
1 回答
300 浏览

apache-drill - Apache Drill 支持事务吗?

我没有在 Drill 的文档中看到对“事务管理”的任何引用。Apache Drill 是否支持事务?有人可以解释一下吗?

0 投票
0 回答
557 浏览

apache - 如何从 Apache 钻取查询生成单个 csv

我试图从钻取的查询中生成一个 csv 表,但结果表明生成的数据文件夹有多个文件大小几乎相等的 csv 文件。我应该如何设置查询以便它只生成一个 csv 文件?谢谢!

下面是我的脚本结构: