问题标签 [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - 快速 Hadoop 分析(Cloudera Impala vs Spark/Shark vs Apache Drill)
我想对 HDFS 中的数据进行一些“近乎实时”的数据分析(类似 OLAP)。
我的研究表明,与 Apache Hive 相比,上述三个框架报告了显着的性能提升。有没有人对其中任何一个有一些实际经验?不仅关乎性能,还关乎稳定性?
pentaho - Impala jdbc 驱动程序与 Pentaho Designer 一起使用
我在让 impala jdbc 驱动程序与 Pentaho Designer 一起工作时遇到了一些麻烦。
我从cloudera 网站获得了 jdbc 驱动程序。提取驱动程序并将它们放在 lib/jdbc 下后,我通过通用数据库建立连接。
- 自定义连接 url 为:jdbc:hive2://example.com:21050/;auth=noSasl
- 自定义驱动类名称为:org.apache.hive.jdbc.HiveDriver
我尝试了一个简单的查询,例如“SELECT count(*) FROM table_1;”,但出现错误:“ParentException: java.sql.SQLException: Method not supported”
有任何想法吗?
cloudera - 当 Impala 中的客户端触发查询时会发生什么?
触发查询时,客户端如何联系 impalad 守护进程?当客户端触发必须由 impala 执行的查询时,后台究竟会发生什么?
cloudera - cloudera impala 中的多个查询执行
是否可以在 impala 中同时执行多个查询?如果是,黑斑羚是如何处理的?
hadoop - 使用什么.. HDFS 上的 Impala,Hbase 上的 Impala 还是 Hbase?
我正在做概念验证任务。任务是使用 Hadoop 技术实现我们产品的一个功能。
功能非常简单,我们有一个 UI 可以让您插入有关“网络问题”的详细信息。捕获有关此类问题的所有详细信息并将其插入到 Oracle DB 中的表中。然后,我们处理此表中的数据并计算健康评分。
我必须使用 Hadoop 而不是传统的 Db 所以我的问题是要做什么?HDFS上的黑斑羚?还是 Hbase 上的 Impala?还是Hbase?
我正在使用 cloudera VM 来实现 POC。
根据我的理解,Hbase 是 NoSQL 分布式数据库,它实际上是 HDFS 上的一层,它提供了 java API 来访问数据。Impala 是一个工具,它还提供 JDBC 访问以通过 Hbase 或直接通过 HDFS 访问数据。我对hadoop很陌生,有人可以帮忙吗?
cloudera - sqoop 查询将 sql server 数据获取到 cloudera manager
sqoop import --connect 'jdbc:sqlserver://IP address;username=user;password=pswd;database=Master' --table [Person].[BusinessEntityContact] --target-dir /home/ubuntu/hdfs/dir不管用 。
参考: http: //mapredit.blogspot.com/2011/10/sqoop-and-microsoft-sql-server.html [1]:http: //i.stack.imgur.com/W5mBB.png
cloudera - 有没有办法在 Cloudera impala 上显示分区?
通常,我可以show partitions <table>
在蜂巢中进行操作。但是当它是拼花桌时,hive 就不明白了。我可以去 hdfs 并检查目录结构,但这并不理想。有没有更好的方法来做到这一点?
sql - 获取同一表中不同行中具有匹配字段的所有行
假设我有一张这样的桌子:
我想获取 website='website.com' 的所有行,并在 website='foo.com' 有一个匹配的 userID 对应的行
因此,在这种情况下,它将返回第 1 行和第 2 行。
有任何想法吗?
hadoop - 从分区文件结构创建 Impala 外部表
提供了一个分区的 fs 结构,如下所示:
我一直在尝试在 Impala 中创建一个外部表:
我希望 Impala 递归到子目录并加载所有 csv 文件;但没有雪茄。不会引发错误,但不会将数据加载到表中。
不同的球体喜欢/logs/log_type/2013/08/*/*
或/logs/log_type/2013/08/*/*/*
不工作。
有没有办法做到这一点?或者我应该重组 fs - 对此有何建议?
java - 是否可以/支持使用 Java 进行 Impala 查询?
我想在 HBase 表上运行 java 中的 impala 查询。我找不到办法做到这一点。
任何人都可以将我指向正确的方向,指向图书馆或示例或任何我可以运行查询并获得结果的地方吗?
我已经尝试使用 jsch 在服务器上运行命令,但不幸的是这给了我问题(没有输出出现)。