问题标签 [trino]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

346 问题

0 投票

2 回答

4658 浏览

presto - Presto SQL 是否像 SQL Server 一样支持使用 CTE 进行递归查询？例如员工层级

我想在 Presto 中使用 CTE 编写一个递归查询来查找 Employee Hierarchy。Presto 支持递归查询吗？当我将简单递归编写为

with cte as(select 1 n union all select cte.n+1 from cte where n<50) select * from cte

它给出的错误是

运行查询时出错：第 3:32 行：表 cte 不存在

presto trino

2019-03-30T04:59:20.943

0 投票

1 回答

88 浏览

amazon-web-services - 是否可以使用 S3 的自定义凭据提供程序从 Presto 的线程上下文中检索用户？

为了让 Presto 访问 S3 上的数据，我需要能够为不同的用户承担不同的角色（例如 Bob -> role1 和 Brenda -> role2）。我知道 EMRFS 提供了此功能，但是我们正在将 Presto 移出 EMR，因此我们不能再使用 EMRFS 来执行此委托。

Presto 允许您为本地 S3 文件系统编写自己的S3 凭证提供程序，但是它只需要两个参数 ajava.net.Uri和 Hadooporg.apache.hadoop.conf.Configuration作为构造函数。

我编写了一个自定义凭据提供程序，它显示了Configuration对象的所有属性，Uri并且既不包含任何与用户有关的信息。

是否可以在不修改 Presto 源代码的情况下从提供者那里获取用户信息？我看到有一个 PR 提交了一段时间（https://github.com/prestodb/presto/pull/2640见最后评论）但由于添加了自定义凭据提供程序而关闭。上面的文档暗示您可以为不同的用户承担不同的 IAM 角色，但我还没有找到上下文是如何传递的。

谢谢！

2019-04-09T19:58:27.630

0 投票

1 回答

1322 浏览

postgresql - 使用 pyspark 连接到 Presto SQL 目录并在 postgresql db 上执行查询的 Pyspark 代码或步骤？

我已将 pyspark 配置为直接使用 PostgreSQL。但是，我想使用 jdbc 连接器将数据从 spark 传递到 presto，然后使用 pyspark 和 presto 在 postgresql 上运行查询。我怎样才能在代码方面做到这一点？

我究竟做错了什么？我想通过 presto 在 postgresql 上运行选择查询，并使用 pyspark 将结果传递回 spark。

我收到以下错误：

当我启用 .option("SSL","true") 时，我收到新错误：

我在做什么错..请帮忙

postgresql apache-spark pyspark presto trino

2019-04-15T13:43:44.200

0 投票

1 回答

8214 浏览

presto - 如何在presto中取消嵌套多列，输出到相应的行

我正在尝试取消嵌套一些代码

我有几列有数组，两列都使用 | 作为分隔符

数据将像这样存储，在显示当前货币的一侧有额外的值

我想像这样输出它我试着做另一个 unnest 列，像这样

但这重复了几行，所以我不确定取消嵌套两列是否不太有效

谢谢

presto trino

2019-04-23T16:13:07.680

0 投票

3 回答

2326 浏览

sql - 在使用聚合函数时减少 Athena 扫描的数据量

下面的查询扫描 100 mb 的数据。

但是下面的查询扫描 15 GB 的数据（有超过 90 个分区）

如何优化第二个查询以扫描与第一个相同数量的数据？

sql presto amazon-athena trino

2019-04-26T18:14:48.900

0 投票

1 回答

6515 浏览

sql - Prestosql 将 UTC 时间戳转换为本地时间戳？

如何在 Prestosql 中将包含日期和时间的时间戳字段转换为本地时间？这些字段看起来像

我有 Region IDS，所以如果我需要或者如果它更容易，我可以在查询中输入该行所需的时区 ID。

我只想返回该时区的本地开始和结束时间。

查询是

其中表 2 是我要转换为当地时间的开始和结束时间......

UTC时间在开始和结束时间的不存在子句中，我如何将其更改为当地时间？在美国不是所有的时间都是同一个时区吗？我可以使用一个区域 ID 字段将该区域 ID 链接到时区，我可以使用它吗？

sql data-science presto datetime-conversion trino

2019-04-30T06:17:40.613

0 投票

1 回答

48 浏览

hadoop - presto + 构建将加入现有 hadoop 集群的 presto 集群

我们有包含所有相关组件/服务的hadoop集群

hadoop clutser 包含 3 台 master 机器和 12 台数据节点机器和 3 台 kafka

现在我们想使用 presto 对数据源（hadoop 集群/配置单元）运行查询

所以我们构建了一个新的 presto 集群作为后续

所有 presto 集群机器都是 redhat 7.2

现在我们要在所有操作系统上安装 presto

但是我们不确定是否可以在 Linux scratch OS 之后不谦虚地安装 presto

或者也许我们需要在操作系统之后和 presto 之前的中间安装一些东西？

hadoop presto trino

2019-04-30T23:32:03.430

0 投票

1 回答

2282 浏览

sql - 从 Row 对象中提取值

按照办公文档https://trino.io/docs/current/functions/map.html。我使用“map_entries”将映射分解为数组（行（K，V））结构。我的问题是如何从行对象中提取 K 和 V 值？目前我必须将它重铸为我定义的 Row 对象。

sql presto trino

2019-05-14T22:04:38.973

0 投票

1 回答

14943 浏览

arrays - 如何在 Presto Athena 中将 varchar 转换为数组

我的数据是VARCHAR格式的。我想拆分这个数组的两个元素，以便我可以从 JSON 中提取一个键值。

数据格式

例如我想skuid从上面的列中提取。所以我提取后的数据应该是这样的：

投射到数组也不起作用：

给出以下错误：

未知类型：数组

所以我无法取消嵌套数组。

我如何在Presto Athena中解决这个问题？

arrays json presto amazon-athena trino

2019-05-16T11:38:20.180

0 投票

1 回答

1291 浏览

amazon-web-services - Amazon Athena 视图实际上是 Hive 视图，还是单独的附加视图？

Amazon Athena 基于 Presto。Amazon Athena 支持视图。

Presto 不支持 Hive 视图，因为它不想处理 Hive 查询语言。由于视图实际上是 Hive 查询，因此它必须了解 Hive 的整个语言，而不仅仅是其架构。Presto通过其 Hive 连接器支持视图。这些视图是“Presto 视图”，是 Presto 特定的（不能从 Hive 查询）。

Athena 是否支持隐藏的 Hive 视图？还是 Athena 视图是一个完全独立的层/螺栓连接，它只保存命名的 Presto/Athena 查询？

amazon-web-services presto amazon-athena trino

2019-05-25T01:22:22.953

1 2 3 4 5 6 7 8 9 10

问题标签 [trino]

数据格式

Reference