问题标签 [apache-drill]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cloudera - apache Drill可以与cloudera hadoop一起使用吗?
我正在尝试在分布式模式下设置 apache Drill。我已经有一个主服务器和两个从服务器的 cloudera hadoop 集群。从 apache Drill 上给出的文档来看,它是否可以使用典型的 cloudera 集群设置还不是很清楚。我找不到任何相关的文章。任何形式的帮助将不胜感激。
mysql - Apache Drill - 查询 HDFS 和 SQL
我正在尝试探索 Apache Drill。我不是数据分析师,只是一个基础设施支持人员。我看到关于 Apache Drill 的文档太有限了
我需要一些有关可与 Apache Drill 一起使用的自定义数据存储的详细信息
- 是否可以像 dfs 一样使用 Apache Drill 在没有 Hive 的情况下查询 HDFS
- 是否可以查询像 MySQL 和 Microsoft SQL 这样的旧 RDBMS
提前致谢
更新:
我的 HDFS 存储防御说错误(无效的 JSON 映射)
如果我用 替换hdfs:///
,file:///
它似乎接受它。
我从文件夹中复制了所有库文件
<drill-path>/jars/3rdparty to <drill-path>/jars/
不能让它工作。请帮忙。我根本不是开发人员,我是 Infra 人。
提前致谢
sql - 使用 SQL 连接到 Mongo - 函数语法
我正在尝试将 Microstrategy 配置为与 MongoDB 一起使用。Mstr 建议的方法是使用 Simba ODBC 驱动程序。简单的连接工作正常。当我想使用函数时问题就开始了,例如从时间戳中只得到一个小时。
我尝试的另一种方法是使用 Apache Drill,我遇到了完全相同的问题。
代码和名称是集合中某些文档的属性,称为 offer。这工作正常。
这失败了。我尝试了不同的语法 postgres - date_part,to_date - Oracle,另一个来自 MySQL ...,EXTRACT 等。
json - 使用 Apache Drill 在 HBase 中获取嵌套的 JSON 数据
我正在使用 Apache Drill 在 HBase 表上运行 SQL 查询。其中一列中的值为:
我想id
使用查询访问该字段。就像是:
如您所见,这不起作用。我对文件中的 JSON 数据进行了类似的查询。我的问题是我可以在 HBase 中查询 JSON 数据吗?
apache - 分布式模式下的 Apache Drill
我开始探索演练,以满足我们在半结构化数据上运行 SQL 的要求。我已经用 zookeeper 设置了一个 4node 钻集群。对它的实际工作原理有几个问题,
当我使用 dfs(本地文件系统)以分布式模式运行 Drill 时,我在其中一个节点(比如 n1)上有一个 1GB 的 Json 文件。我可以通过从任何节点(n1、n2、n3、n4)启动 sqlline 来运行查询,inspire 只有在 n1 上有日期。我的问题是
一个。查询是否在所有节点上执行?即,Drill 会通过将数据分发到其他节点 n2、n3n4 来并行化查询执行吗?
湾。如果否,通过在所有节点 n2、n3、n4 上复制相同的文件将有助于利用 Drill 的 MPP 架构?
apache - 通过 Java 连接 Apache Drill
在整个 Apache Drill 的 Wiki 中,我只能看到通过 SqlLine 客户端运行的查询。除了 REST API 之外,还有其他编程方式可以在 Drill 中运行查询吗?任何样本或指针?
还是和使用 JDBC 驱动程序运行 SQL 查询一样?
nullpointerexception - 为什么在查询带有可选 Null 列的镶木地板文件时,apache Drill 返回 Null 指针异常?
我正在使用 protobuf(或 Avro)写入镶木地板文件。我的原型文件如下所示:
这是我的问题的简化版本。现在,当写入镶木地板文件(非 hadoop)时,我希望有一种情况,其中一列根本没有数据(我正在研究模式演变)。所以我只是在镶木地板文件中为“日期”列写值。文件已成功创建,但是当我尝试通过 apache Drill 查询它时,它会引发空指针异常。如果至少对于一个书面记录,我设置了'url'字段,那么就可以了,所有其他'url'值都可以为空,并且可以查询它。但是我需要在 parquet 文件中整列为空的情况(但其他 parquet 文件具有该列的值)。请帮帮我。我的镶木地板版本是:1.6.0rc7 和 apache Drill 版本是 0.8.0 这里是代码:LogClass 是从 proto 文件编译的类
amazon-redshift - Apache Drill 可以连接到 Amazon RedShift 吗?
Apache Drill 可以连接到 Amazon RedShift 吗?如果是,任何人都可以帮助我配置 Apache Drill 以连接到 Amazon RedShift 的插件。
apache-drill - Apache Drill UI 服务器绑定问题
我正在尝试配置 Apache Drill。我已经下载、构建和测试了一些东西,在 Zookeeper 上配置的集群似乎运行良好。我对钻头启动没问题,除了 Drill 使用的内置 Jetty 服务器之外的所有服务器都没有自动绑定到所有 ips。
netstat 的输出:
我想让它从 0.0.0.0 开始收听。
任何指针表示赞赏。
hadoop - Apache Drill 与 Spark
我对 Apache Spark 和 Spark-SQL 有一些经验。最近我发现了 Apache Drill 项目。您能否描述一下它们之间最显着的优势/差异是什么?我已经阅读了 Fast Hadoop Analytics(Cloudera Impala vs Spark/Shark vs Apache Drill) ,但这个主题对我来说仍然不清楚。