问题标签 [presto]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-kinesis - 在 kinesis 上运行 presto 查询时出错
在 kinesis 上运行 presto 查询时出现以下错误。
查询 20151031_142753_00003_xxxxx 失败:帐户 xxxxxx 下的流 xxxxx 超出速率。(服务:AmazonKinesis;状态代码:400;错误代码:ProvisionedThroughputExceededException;请求 ID:94fb720d-7fdb-11e5-994c-83dc0xxxxxx)
我正在使用 qubole 的 presto-kinesis 连接器。
任何想法,如何解决
amazon-web-services - PrestoDB EMR 服务器拒绝连接
我已经在 AWS 中设置了一个安装了 PrestoDB 的 EMR,之前我能够使用 PrestoDB 进行查询,但不知何故在重新启动后它停止工作并开始给出以下错误“错误运行命令:服务器拒绝连接:http://ip- * - - - .us-west-2.compute.internal:8889/v1/statement" 我查看了所有配置文件,似乎没有任何问题。我也交叉检查了 Hive 配置文件,但没有成功。任何遇到类似问题的人都可以帮助我。
sql - Presto 上的 UNION ALL / UNION
我正在使用宝藏数据进行数据分析,并且在 presto db 中遇到 union 语句的问题。
我如何在 presto 上进行 Union All。我不明白文档。每次我尝试这样做 UNION 时:
我得到重新格式化的输出,如:
和错误说:
我想我不理解 Presto 的语法。文档对 Union 非常混乱。任何帮助表示赞赏。
cassandra - PrestoDB v0.125 SELECT 仅返回 Cassandra 记录的子集
PrestoDB v0.125 中使用 Cassandra 连接器连接到 Datastax Cassandra 集群的 SELECT 语句仅返回 200 行,即使表包含比这更多的行。像 SELECT COUNT() 这样对同一个表的聚合查询也只返回 200 的结果。
(使用 pyhive 连接器和基本 presto CLI 查询时,此行为是相同的)。
文档没有太大帮助,但我猜测问题是分页和需要设置环境变量(文档没有解释): https ://prestodb.io/docs/current/installation/cli.html
有谁知道我可以如何删除返回的 200 行的限制?我需要什么特定的环境变量设置?
presto - 将数据集从文本文件格式转换为“presto-orc”格式以获得更好的 prestoDB 性能
我检查了这个博客https://code.facebook.com/posts/370832626374903/even-faster-data-at-the-speed-of-presto-orc/。
如何使用这种“presto-orc”文件格式?
我在 S3 中有文本格式的数据。我想以“presto-orc”格式重写。
我一般使用 hive 将数据写入 ORC/RCFile/Parquet。
sql - SQL查询时间戳的不同部分
我有一个预留表,其中包含预留的资源和附加到每个预留的时间戳。
我希望能够按每个月、每个小时、每个资源细分每个资源的利用率。
是否可以执行一个 SQL 查询,例如给我以下示例输出(简化数据,我实际上在数据库中有一个时间戳,但需要通过月份和小时将其分开)?
我觉得这不是可以实现的吗?
presto - Prestodb CLI mysql 连接器找不到名称中带有下划线的数据库
例如:
返回:
虽然 records_1 存在并且其中有表。
在没有下划线的数据库上运行时,结果是可以的。
有人遇到过这个问题吗?任何决议?
mysql - 将 timeFrom 和 timeTo 拆分为小时间隔
我有以下内容:
我想创造一些能给我所有小时间隔的东西。像这样:
有没有一种简单的方法可以实现这一目标?这似乎应该很常见,但找不到与此相关的任何内容。
我有很多天的记录,快一年了。所有单独的记录(timeFrom,timeTo)都在同一天内(它们不跨越多天)。
我正在使用 PrestoDB
sql - 如何将子查询包含到内部联接中?
如何将子查询包含到内部联接中?
我有以下 SQL:
这给了我这样的数据:
我想要一个数字表并进行如下内部连接:
所以我可以得到这样的东西:
如何使用第一个查询的结果进行内部联接(用该查询结果替换 mytable)?这可能吗?我一直无法找到一种方法来插入我的查询以对其执行内部联接。
我对 SQL 语法不是很有经验,尽管看了一整天也找不到答案。
sql - 总和 每月全天每天每小时的总利用率
我有以下使用 PrestoDB 的 SQL 查询:
它像这样返回表:
如您所见,HourFrom 和 HourTo 列按天拆分。有没有办法聚合它们,以便我在一个月的所有日子里得到每个小时的总和/总数?
所以说我有 1 月和 2 月的数据,我们只在凌晨 1 点到 4 点开放,并且只有 2 个资源,那么我想要获得的最终表看起来像这样(即 Jan1AM - Jan2AM 给了我利用率数[总] 在 1 月份的那个时间范围内的所有日子连续):
我将如何更改我的原始查询来做这样的事情?