问题标签 [qubole]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

86 问题

0 投票

1 回答

67 浏览

sql - SQL代码性能优化建议

我在 Qubole 中有一个代码需要将近 3 个小时才能执行。我正在寻找一些减少代码执行时间的建议。

sql performance query-optimization qubole

2019-04-11T17:09:38.060

0 投票

1 回答

59 浏览

java - 使用 java 获取 Qubole 数据行明智

我正在尝试使用Qubole SDKhive运行查询。虽然我能够获得所需的结果，但为了更好地处理它，我希望逐行访问它。类似于 java 对象列表的东西。string

获取数据的方式是：

控制台给出如下输出：

我希望以列表的形式设置这个结果集，我可以对其进行迭代，而不是解析或标记一堆字符串。

如果存在，则无法找到任何库或类。

java hive qubole

2019-04-18T10:09:28.937

0 投票

1 回答

4010 浏览

hadoop - 如何使用 hive 1.2 从 s3 中的镶木地板文件创建外部表？

我在 Qubole(Hive) 中创建了一个外部表，它从 s3 读取 parquet(compressed: snappy) 文件，但是在执行SELECT * table_name 时我得到了除分区列之外的所有列的空值。

我尝试在 SERDEPROPERTIES 中使用不同的 serialization.format 值，但我仍然面临同样的问题。在删除'serialization.format' = '1'我得到的财产时ERROR: Failed with exception java.io.IOException:Can not read value at 0 in block -1 in file s3://path_to_parquet/。

我检查了 parquet 文件，并能够使用 parquet-tools 读取数据：

hadoop hive hiveql qubole

2019-05-15T20:21:03.297

0 投票

1 回答

37 浏览

hadoop - 检索使用 hadoop distcp 复制的数据大小

我正在运行一个 hadoop distcp 命令，如下所示：

我想知道通过运行此命令复制的数据的大小。我打算在 Qubole 上运行命令。

任何帮助表示赞赏

hadoop size distcp qubole

2019-05-16T23:41:41.223

0 投票

1 回答

427 浏览

json - 使用数据集从 Hive 中的字符串中提取 json 字段

我正在尝试一个非常基本的配置单元查询。我正在尝试从数据集中提取 json 字段，但我总是得到

\N

对于 json 字段，但是 some_string 没问题

这是我的查询：

问题：如何在此处获取 json 字段？

json hive hiveql qubole

2019-05-30T18:25:42.360

0 投票

2 回答

115 浏览

scala - 在类中实现案例类

我正在使用下面的代码在 Qubole Notebook 中运行，并且代码运行成功。

但是，当我在 Qubole 的分析中运行相同的代码时，我收到以下错误。

当我取出下面的代码时，它在 Qubole 的 Anlayze 中运行良好。

我相信在某个地方我必须改变case类的用法。

我正在使用 Spark 2.3。

有人可以让我知道如何解决这个问题。

如果您需要任何其他详细信息，请告诉我。

scala apache-spark apache-spark-sql apache-spark-dataset qubole

2019-07-10T14:17:53.703

0 投票

0 回答

677 浏览

scala - 如何修复 Spark Scala 中的“格式错误的类名”错误？

在 Qubole 笔记本中，我试图从 API 响应中获取某些字符串。对于示例数据，它似乎工作得很好，但是当我使用完整集时失败了。星火版本：2.3.1；斯卡拉版本：2.11；scalaj-http 版本：2.4.2

我为样本数据获得的预期结果示例：

当我尝试处理我必须处理的所有 search_destination_id 时收到错误消息：

请告知导致此错误的原因以及如何避免它。

scala apache-spark qubole scalaj-http

2019-07-18T13:49:19.773

0 投票

1 回答

90 浏览

performance - 使用 Spark Streaming Application 的 Sparklens 进行性能分析

我正在尝试使用sparklens对火花流应用程序进行性能分析。它给出了这样的结果

即使如果我增加执行者，估计的时间也是一样的。

这些建议是否正确？

performance apache-spark qubole

2019-08-02T16:30:08.597

0 投票

1 回答

419 浏览

hive - 如何在qubole上使用avro文件创建hive外部表？

有人可以在文档中指出基于 avro 文件在 qubole 上创建外部表吗？

以下目录有一堆avro文件

hive avro qubole

2019-10-25T01:25:39.893

0 投票

1 回答

46 浏览

qubole - 在新的分析 UI 中，如何编辑查询的标题？

在最近推出的新 Qubole 分析 UI 中，我似乎找不到更改命令标题的方法。在旧界面中，我可以点击命令标题，它会变成一个可编辑的文本框。

qubole

2019-11-18T17:09:55.337

1 2 3 4 5 6 7 8 9 10