问题标签 [apache-drill]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

622 问题

0 投票

3 回答

4259 浏览

cloudera - apache Drill可以与cloudera hadoop一起使用吗？

我正在尝试在分布式模式下设置 apache Drill。我已经有一个主服务器和两个从服务器的 cloudera hadoop 集群。从 apache Drill 上给出的文档来看，它是否可以使用典型的 cloudera 集群设置还不是很清楚。我找不到任何相关的文章。任何形式的帮助将不胜感激。

cloudera apache-drill

2015-02-20T17:54:56.693

0 投票

2 回答

1611 浏览

mysql - Apache Drill - 查询 HDFS 和 SQL

我正在尝试探索 Apache Drill。我不是数据分析师，只是一个基础设施支持人员。我看到关于 Apache Drill 的文档太有限了

我需要一些有关可与 Apache Drill 一起使用的自定义数据存储的详细信息

是否可以像 dfs 一样使用 Apache Drill 在没有 Hive 的情况下查询 HDFS
是否可以查询像 MySQL 和 Microsoft SQL 这样的旧 RDBMS

提前致谢

更新：

我的 HDFS 存储防御说错误（无效的 JSON 映射）

如果我用替换hdfs:///，file:///它似乎接受它。

我从文件夹中复制了所有库文件

<drill-path>/jars/3rdparty to <drill-path>/jars/

不能让它工作。请帮忙。我根本不是开发人员，我是 Infra 人。

提前致谢

2015-02-27T12:50:02.217

0 投票

1 回答

168 浏览

sql - 使用 SQL 连接到 Mongo - 函数语法

我正在尝试将 Microstrategy 配置为与 MongoDB 一起使用。Mstr 建议的方法是使用 Simba ODBC 驱动程序。简单的连接工作正常。当我想使用函数时问题就开始了，例如从时间戳中只得到一个小时。

我尝试的另一种方法是使用 Apache Drill，我遇到了完全相同的问题。

代码和名称是集合中某些文档的属性，称为 offer。这工作正常。

这失败了。我尝试了不同的语法 postgres - date_part，to_date - Oracle，另一个来自 MySQL ...，EXTRACT 等。

sql apache mongodb apache-drill simba

2015-03-10T13:51:00.560

0 投票

2 回答

1604 浏览

json - 使用 Apache Drill 在 HBase 中获取嵌套的 JSON 数据

我正在使用 Apache Drill 在 HBase 表上运行 SQL 查询。其中一列中的值为：

我想id使用查询访问该字段。就像是：

如您所见，这不起作用。我对文件中的 JSON 数据进行了类似的查询。我的问题是我可以在 HBase 中查询 JSON 数据吗？

json hbase apache-drill

2015-03-27T22:27:50.560

0 投票

2 回答

594 浏览

apache - 分布式模式下的 Apache Drill

我开始探索演练，以满足我们在半结构化数据上运行 SQL 的要求。我已经用 zookeeper 设置了一个 4node 钻集群。对它的实际工作原理有几个问题，

当我使用 dfs（本地文件系统）以分布式模式运行 Drill 时，我在其中一个节点（比如 n1）上有一个 1GB 的 Json 文件。我可以通过从任何节点（n1、n2、n3、n4）启动 sqlline 来运行查询，inspire 只有在 n1 上有日期。我的问题是

一个。查询是否在所有节点上执行？即，Drill 会通过将数据分发到其他节点 n2、n3n4 来并行化查询执行吗？

湾。如果否，通过在所有节点 n2、n3、n4 上复制相同的文件将有助于利用 Drill 的 MPP 架构？

apache hive mapr apache-drill

2015-03-31T09:35:39.393

0 投票

4 回答

5044 浏览

apache - 通过 Java 连接 Apache Drill

在整个 Apache Drill 的 Wiki 中，我只能看到通过 SqlLine 客户端运行的查询。除了 REST API 之外，还有其他编程方式可以在 Drill 中运行查询吗？任何样本或指针？

还是和使用 JDBC 驱动程序运行 SQL 查询一样？

apache hadoop apache-drill

2015-04-04T07:03:19.160

0 投票

0 回答

787 浏览

nullpointerexception - 为什么在查询带有可选 Null 列的镶木地板文件时，apache Drill 返回 Null 指针异常？

我正在使用 protobuf（或 Avro）写入镶木地板文件。我的原型文件如下所示：

这是我的问题的简化版本。现在，当写入镶木地板文件（非 hadoop）时，我希望有一种情况，其中一列根本没有数据（我正在研究模式演变）。所以我只是在镶木地板文件中为“日期”列写值。文件已成功创建，但是当我尝试通过 apache Drill 查询它时，它会引发空指针异常。如果至少对于一个书面记录，我设置了'url'字段，那么就可以了，所有其他'url'值都可以为空，并且可以查询它。但是我需要在 parquet 文件中整列为空的情况（但其他 parquet 文件具有该列的值）。请帮帮我。我的镶木地板版本是：1.6.0rc7 和 apache Drill 版本是 0.8.0 这里是代码：LogClass 是从 proto 文件编译的类

nullpointerexception protocol-buffers avro parquet apache-drill

2015-04-13T14:08:37.453

0 投票

2 回答

1117 浏览

amazon-redshift - Apache Drill 可以连接到 Amazon RedShift 吗？

Apache Drill 可以连接到 Amazon RedShift 吗？如果是，任何人都可以帮助我配置 Apache Drill 以连接到 Amazon RedShift 的插件。

amazon-redshift apache-drill

2015-04-16T18:00:01.617

0 投票

1 回答

157 浏览

apache-drill - Apache Drill UI 服务器绑定问题

我正在尝试配置 Apache Drill。我已经下载、构建和测试了一些东西，在 Zookeeper 上配置的集群似乎运行良好。我对钻头启动没问题，除了 Drill 使用的内置 Jetty 服务器之外的所有服务器都没有自动绑定到所有 ips。

netstat 的输出：

我想让它从 0.0.0.0 开始收听。

任何指针表示赞赏。

apache-drill

2015-04-21T12:10:59.960

0 投票

3 回答

10343 浏览

hadoop - Apache Drill 与 Spark

我对 Apache Spark 和 Spark-SQL 有一些经验。最近我发现了 Apache Drill 项目。您能否描述一下它们之间最显着的优势/差异是什么？我已经阅读了 Fast Hadoop Analytics（Cloudera Impala vs Spark/Shark vs Apache Drill），但这个主题对我来说仍然不清楚。

hadoop apache-spark bigdata apache-drill

2015-04-22T07:29:43.667

1 2 3 4 5 6 7 8 9 10

问题标签 [apache-drill]

Reference