问题标签 [trino]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
presto - Presto SQL 是否像 SQL Server 一样支持使用 CTE 进行递归查询?例如员工层级
我想在 Presto 中使用 CTE 编写一个递归查询来查找 Employee Hierarchy。Presto 支持递归查询吗?当我将简单递归编写为
with cte as(select 1 n
union all
select cte.n+1 from cte where n<50)
select * from cte
它给出的错误是
运行查询时出错:第 3:32 行:表 cte 不存在amazon-web-services - 是否可以使用 S3 的自定义凭据提供程序从 Presto 的线程上下文中检索用户?
为了让 Presto 访问 S3 上的数据,我需要能够为不同的用户承担不同的角色(例如 Bob -> role1 和 Brenda -> role2)。我知道 EMRFS 提供了此功能,但是我们正在将 Presto 移出 EMR,因此我们不能再使用 EMRFS 来执行此委托。
Presto 允许您为本地 S3 文件系统编写自己的S3 凭证提供程序,但是它只需要两个参数 ajava.net.Uri
和 Hadooporg.apache.hadoop.conf.Configuration
作为构造函数。
我编写了一个自定义凭据提供程序,它显示了Configuration
对象的所有属性,Uri
并且既不包含任何与用户有关的信息。
是否可以在不修改 Presto 源代码的情况下从提供者那里获取用户信息?我看到有一个 PR 提交了一段时间(https://github.com/prestodb/presto/pull/2640见最后评论)但由于添加了自定义凭据提供程序而关闭。上面的文档暗示您可以为不同的用户承担不同的 IAM 角色,但我还没有找到上下文是如何传递的。
谢谢!
postgresql - 使用 pyspark 连接到 Presto SQL 目录并在 postgresql db 上执行查询的 Pyspark 代码或步骤?
我已将 pyspark 配置为直接使用 PostgreSQL。但是,我想使用 jdbc 连接器将数据从 spark 传递到 presto,然后使用 pyspark 和 presto 在 postgresql 上运行查询。我怎样才能在代码方面做到这一点?
我究竟做错了什么?我想通过 presto 在 postgresql 上运行选择查询,并使用 pyspark 将结果传递回 spark。
我收到以下错误:
当我启用 .option("SSL","true") 时,我收到新错误:
我在做什么错..请帮忙
presto - 如何在presto中取消嵌套多列,输出到相应的行
sql - 在使用聚合函数时减少 Athena 扫描的数据量
下面的查询扫描 100 mb 的数据。
但是下面的查询扫描 15 GB 的数据(有超过 90 个分区)
如何优化第二个查询以扫描与第一个相同数量的数据?
sql - Prestosql 将 UTC 时间戳转换为本地时间戳?
如何在 Prestosql 中将包含日期和时间的时间戳字段转换为本地时间?这些字段看起来像
我有 Region IDS,所以如果我需要或者如果它更容易,我可以在查询中输入该行所需的时区 ID。
我只想返回该时区的本地开始和结束时间。
查询是
其中表 2 是我要转换为当地时间的开始和结束时间......
UTC时间在开始和结束时间的不存在子句中,我如何将其更改为当地时间?在美国不是所有的时间都是同一个时区吗?我可以使用一个区域 ID 字段将该区域 ID 链接到时区,我可以使用它吗?
hadoop - presto + 构建将加入现有 hadoop 集群的 presto 集群
我们有包含所有相关组件/服务的hadoop集群
hadoop clutser 包含 3 台 master 机器和 12 台数据节点机器和 3 台 kafka
现在我们想使用 presto 对数据源(hadoop 集群/配置单元)运行查询
所以我们构建了一个新的 presto 集群作为后续
所有 presto 集群机器都是 redhat 7.2
现在我们要在所有操作系统上安装 presto
但是我们不确定是否可以在 Linux scratch OS 之后不谦虚地安装 presto
或者也许我们需要在操作系统之后和 presto 之前的中间安装一些东西?
sql - 从 Row 对象中提取值
按照办公文档https://trino.io/docs/current/functions/map.html。我使用“map_entries”将映射分解为数组(行(K,V))结构。我的问题是如何从行对象中提取 K 和 V 值?目前我必须将它重铸为我定义的 Row 对象。
arrays - 如何在 Presto Athena 中将 varchar 转换为数组
我的数据是VARCHAR
格式的。我想拆分这个数组的两个元素,以便我可以从 JSON 中提取一个键值。
数据格式
例如我想skuid
从上面的列中提取。所以我提取后的数据应该是这样的:
投射到数组也不起作用:
给出以下错误:
未知类型:数组
所以我无法取消嵌套数组。
我如何在Presto Athena中解决这个问题?
amazon-web-services - Amazon Athena 视图实际上是 Hive 视图,还是单独的附加视图?
Amazon Athena 基于 Presto。Amazon Athena 支持视图。
Presto 不支持 Hive 视图,因为它不想处理 Hive 查询语言。由于视图实际上是 Hive 查询,因此它必须了解 Hive 的整个语言,而不仅仅是其架构。Presto通过其 Hive 连接器支持视图。这些视图是“Presto 视图”,是 Presto 特定的(不能从 Hive 查询)。
Athena 是否支持隐藏的 Hive 视图?还是 Athena 视图是一个完全独立的层/螺栓连接,它只保存命名的 Presto/Athena 查询?