问题标签 [shark-sql]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

59 问题

0 投票

6 回答

17755 浏览

hadoop - 通过 ODBC 连接到 Spark SQL

根据此页面：https ://spark.apache.org/sql/您可以通过 ODBC 或 JDBC 将现有的 BI 工具连接到 Spark SQL： spark sql的屏幕截图

我不是说鲨鱼，因为这基本上是EOL：

正是出于这个原因，我们将在 Shark 中作为一个单独的项目结束开发，并将我们所有的开发资源转移到 Spark SQL，这是 Spark 中的一个新组件。

BI 工具（如 Tableau）如何通过 ODBC 连接到 Shark sql？

2014-09-08T18:05:45.263

0 投票

1 回答

88 浏览

apache-spark - 如何从 RDD 中保存的文本文件创建 Shark 查询？

我有一个JavaPairRDD<String, String> results，我通过调用保存它：

然后我得到如下文件内容：

现在，我想使用 Shark 创建一个包含三个字段的表，例如：

我怎样才能做到这一点？

apache-spark shark-sql apache-spark-sql

2014-09-28T15:26:29.957

0 投票

1 回答

59 浏览

apache-spark - 我们可以将 Shark 0.9.1 版本与 Spark 1.1.0 一起使用吗？

我知道 Shark 已被 Spark SQL 所包含，这是 Apache Spark 中的一个新模块。但我的问题是，我们可以将现有的 Shark 与新的 Spark 版本一起使用吗？

apache-spark apache-spark-sql shark-sql

2014-10-14T10:05:30.787

0 投票

2 回答

1637 浏览

apache-spark - Spark 是否支持插入覆盖静态分区？

我注意到在当前的 Spark Sql 手册中不支持插入动态分区：

主要蜂巢功能

Spark SQL 当前不支持使用动态分区插入表。

但是，是否支持在静态分区中插入/覆盖？

apache-spark shark-sql apache-spark-sql

2014-11-04T20:09:50.390

0 投票

1 回答

603 浏览

hadoop - 就速度而言，鲨鱼或火花哪个更好

我对这两个很困惑。我知道鲨鱼和蜂巢一样，速度快 100 倍，在火花上工作。我想知道火花和鲨鱼之间的主要区别。哪个更好意味着更快。

当我必须使用火花或鲨鱼时？？？？

hadoop hive apache-spark shark-sql

2014-11-21T13:08:49.910

0 投票

1 回答

352 浏览

java - java HiveClient 失败选择：java.sql.SQLException：查询返回非零代码：9

我对 Hive 和 HDFS 还很陌生，但是我设法在 java 中创建了一个功能正常的 HiveClient，它成功地连接并在我的 HDFS 服务器上执行查询。也就是说，除了select语句之外的所有查询。

我的代码如下所示：

当我运行它时，错误是这样的：

java.sql.SQLException：查询返回非零代码：9，原因：FAILED：执行错误，从org.apache.hadoop.hive.jdbc.HiveStatement.executeQuery（HiveStatement.java）的shark.execution.SparkTask返回代码-101 :194) 在 se.HiveClient.doQuery(HiveClient.java:56) 在 se.HiveClient.main(HiveClient.java:82)

但如果我改为创建表或显示表，它运行完美。是否存在缺少配置或权限的情况？还是完全不同的东西？

任何关于我可能在哪里做错或错过了什么的想法都非常感谢。

java hadoop jdbc hive shark-sql

2014-12-09T16:44:54.727

0 投票

1 回答

1416 浏览

apache-spark - SPARK - 如何通过查询使用分组功能

我要将SHARK查询迁移到SPARK中。

下面是我在 group by 子句中使用函数的示例SHARK查询。

同样的查询在SPARK sql 中不起作用，它给出了以下错误；

错误： org.apache.spark.sql.catalyst.errors.package$TreeNodeException：表达式不在 GROUP BY 中。

因此，作为解决方案的一部分，我在 SPARK 查询下使用，这是有效的，但需要更改代码。这对我现有的项目影响很大。因此，任何人都有一个影响最小的更好的解决方案。

apache-spark shark-sql

2015-01-08T13:09:09.190

0 投票

1 回答

138 浏览

hadoop - 如果表包含重复行，则返回布尔值（1 或 0）

如果 Hive 0.9 中的表中有重复项，我希望返回一个布尔值现在，我正在这样做：

但这给了我一个错误：

“无法识别'where''v''附近的输入。' 在子查询源 [DB Errorcode=11] "

我不确定我哪里出错了，或者我在这里错过了什么！

hadoop apache-spark hive hiveql shark-sql

2015-09-09T22:43:46.520

0 投票

0 回答

192 浏览

shark-sql - 鲨鱼：失败：语义分析错误：预计只有一个参数

在创建了一个包含 5000 行小于 1000 的随机整数的表后，我正在使用 APPROX_SUM 查询。

它总是导致异常

预计只有一个论点。

但我只使用一列只有整数，如下所述。我正在运行鲨鱼信息。有人可以给我一个关于如何解决问题的提示吗？

shark-sql

2018-10-11T17:14:52.187

1 2 3 4 5 6 7 8 9 10

问题标签 [shark-sql]

Reference