问题标签 [presto]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
147 浏览

amazon-kinesis - 在 kinesis 上运行 presto 查询时出错

在 kinesis 上运行 presto 查询时出现以下错误。

查询 20151031_142753_00003_xxxxx 失败:帐户 xxxxxx 下的流 xxxxx 超出速率。(服务:AmazonKinesis;状态代码:400;错误代码:ProvisionedThroughputExceededException;请求 ID:94fb720d-7fdb-11e5-994c-83dc0xxxxxx)

我正在使用 qubole 的 presto-kinesis 连接器。

任何想法,如何解决

0 投票
2 回答
734 浏览

amazon-web-services - PrestoDB EMR 服务器拒绝连接

我已经在 AWS 中设置了一个安装了 PrestoDB 的 EMR,之前我能够使用 PrestoDB 进行查询,但不知何故在重新启动后它停止工作并开始给出以下错误“错误运行命令:服务器拒绝连接:http://ip- * - - - .us-west-2.compute.internal:8889/v1/statement" 我查看了所有配置文件,似乎没有任何问题。我也交叉检查了 Hive 配置文件,但没有成功。任何遇到类似问题的人都可以帮助我。

0 投票
1 回答
23868 浏览

sql - Presto 上的 UNION ALL / UNION

我正在使用宝藏数据进行数据分析,并且在 presto db 中遇到 union 语句的问题。

我如何在 presto 上进行 Union All。我不明白文档。每次我尝试这样做 UNION 时:

我得到重新格式化的输出,如:

和错误说:

我想我不理解 Presto 的语法。文档对 Union 非常混乱。任何帮助表示赞赏。

0 投票
1 回答
212 浏览

cassandra - PrestoDB v0.125 SELECT 仅返回 Cassandra 记录的子集

PrestoDB v0.125 中使用 Cassandra 连接器连接到 Datastax Cassandra 集群的 SELECT 语句仅返回 200 行,即使表包含比这更多的行。像 SELECT COUNT() 这样对同一个表的聚合查询也只返回 200 的结果。

(使用 pyhive 连接器和基本 presto CLI 查询时,此行为是相同的)。

文档没有太大帮助,但我猜测问题是分页和需要设置环境变量(文档没有解释): https ://prestodb.io/docs/current/installation/cli.html

有谁知道我可以如何删除返回的 200 行的限制?我需要什么特定的环境变量设置?

0 投票
1 回答
422 浏览

presto - 将数据集从文本文件格式转换为“presto-orc”格式以获得更好的 prestoDB 性能

我检查了这个博客https://code.facebook.com/posts/370832626374903/even-faster-data-at-the-speed-of-presto-orc/

如何使用这种“presto-orc”文件格式?

我在 S3 中有文本格式的数据。我想以“presto-orc”格式重写。

我一般使用 hive 将数据写入 ORC/RCFile/Parquet。

0 投票
0 回答
74 浏览

sql - SQL查询时间戳的不同部分

我有一个预留表,其中包含预留的资源和附加到每个预留的时间戳。

我希望能够按每个月、每个小时、每个资源细分每个资源的利用率。

是否可以执行一个 SQL 查询,例如给我以下示例输出(简化数据,我实际上在数据库中有一个时间戳,但需要通过月份和小时将其分开)?

我觉得这不是可以实现的吗?

0 投票
1 回答
61 浏览

presto - Prestodb CLI mysql 连接器找不到名称中带有下划线的数据库

例如:

返回:

虽然 records_1 存在并且其中有表。

在没有下划线的数据库上运行时,结果是可以的。

有人遇到过这个问题吗?任何决议?

0 投票
2 回答
153 浏览

mysql - 将 timeFrom 和 timeTo 拆分为小时间隔

我有以下内容:

我想创造一些能给我所有小时间隔的东西。像这样:

有没有一种简单的方法可以实现这一目标?这似乎应该很常见,但找不到与此相关的任何内容。

我有很多天的记录,快一年了。所有单独的记录(timeFrom,timeTo)都在同一天内(它们不跨越多天)。

我正在使用 PrestoDB

0 投票
1 回答
80 浏览

sql - 如何将子查询包含到内部联接中?

如何将子查询包含到内部联接中?

我有以下 SQL:

这给了我这样的数据:

我想要一个数字表并进行如下内部连接:

所以我可以得到这样的东西:

如何使用第一个查询的结果进行内部联接(用该查询结果替换 mytable)?这可能吗?我一直无法找到一种方法来插入我的查询以对其执行内部联接。

我对 SQL 语法不是很有经验,尽管看了一整天也找不到答案。

0 投票
1 回答
103 浏览

sql - 总和 每月全天每天每小时的总利用率

我有以下使用 PrestoDB 的 SQL 查询:

它像这样返回表:

如您所见,HourFrom 和 HourTo 列按天拆分。有没有办法聚合它们,以便我在一个月的所有日子里得到每个小时的总和/总数?

所以说我有 1 月和 2 月的数据,我们只在凌晨 1 点到 4 点开放,并且只有 2 个资源,那么我想要获得的最终表看起来像这样(即 Jan1AM - Jan2AM 给了我利用率数[总] 在 1 月份的那个时间范围内的所有日子连续):

我将如何更改我的原始查询来做这样的事情?