问题标签 [apache-drill]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-camel - 将 HL7 v2 转换为 JSON
我希望将 HL7 v2(较旧的 EDI 格式)消息转换为 JSON,因此我可以使它们在 Apache Drill 下可处理并在 Parquet 下可压缩。
我调查了HAPI,但我没有找到用于非 XML HL7 到 JSON 转换的实用程序。
有人对图书馆有建议或参考吗?
cassandra-2.0 - 如何在嵌入式模式下将 apache-drill 与 cassandra 连接
我想将钻与 cassandra 连接起来。我找到了一个博客,但是当我按照该博客的说明进行操作时出现错误。有谁知道如何连接两者?
apache-drill - 使用 Apache Drill 查询嵌入式 json 时出错
donutTest.json (在我的本地系统 /home/dev 中):
此查询工作正常。
但是当我尝试时:
它显示错误。
找不到表“击球手”
topping[0]
并且batter
两者都是嵌入式文档仍然错误。
apache-drill - Dremel 或其实现(例如 Drill)如何处理内存中的大型列式数据布局?
我正在阅读 Google Dremel 的白皮书。我知道它将复杂数据转换为列式数据布局。
这些数据存储在什么位置?
由于 Drill 没有中央元数据存储库,我假设它必须是in-memory。
因此,当我有数十亿行时,Drill 如何处理这些数据?
json - 使用 Apache Drill 搜索 Firebase JSON
我从https://domain.firebaseio.com/users/导出了部分数据
执行:SELECT * FROM dfs。/Users/me/Desktop/users.json
但是如何将列映射为行中的值。从关系数据库世界来看,屏幕截图中的列标题是唯一的 ID (3, 4) - 这些应该是行的一部分,而不是列标题。使用 push({}) 时生成的唯一生成的密钥也是如此
目标当然是做一个 Select Where (select * from data where fullname="Mario Test") 例如
在使用 Drill 搜索 JSON 之前,我应该对它进行某种预处理吗?
parquet - apache钻内存异常
我正在尝试在单节点设置中使用 apache Drill 将超过 600gb 的 csv 文件重新格式化为镶木地板。
我运行我的 sql 语句:
它正在创建镶木地板文件,但出现错误:
有没有解决的办法?还是有其他方法可以进行转换?
scala - 使用 Kryo 序列化的 Apache Drill 查询数据
我通过使用Kryo(com.twitter.chill . _ _ _ KryoInjection)。
现在我想用Apache Drill查询这些数据,并将它从序列化的字节数组转换为人类可读的东西。
我想我会以某种方式在Apache Drill中“注册”我自己的转换器并将其提供给钻取查询。
不幸的是,我无法找到有关是否以及如何完成的任何信息。
apache-drill - Apache Drill 支持事务吗?
我没有在 Drill 的文档中看到对“事务管理”的任何引用。Apache Drill 是否支持事务?有人可以解释一下吗?
apache - 如何从 Apache 钻取查询生成单个 csv
我试图从钻取的查询中生成一个 csv 表,但结果表明生成的数据文件夹有多个文件大小几乎相等的 csv 文件。我应该如何设置查询以便它只生成一个 csv 文件?谢谢!
下面是我的脚本结构: