问题标签 [presto-jdbc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
22 浏览

presto - presto 查询以通过正则表达式模式检索表

想要使用 presto sql 根据特定名称获取表名。

数据库中的示例表:Tiggered_prod

预期结果:

0 投票
1 回答
1017 浏览

sql - 类似的方法,比如 presto 中的 TRY_CAST

在 SQL Server 中,有 TRY_CAST 方法可用于检查是否可以进行强制转换。如果强制转换是不可能的,那么它将设置 NULL 作为值。

presto 中是否有类似的方法可用?或者如何在 presto 中实现类似的行为?

0 投票
1 回答
285 浏览

sql - 跳过格式错误的日期解析 presto

我正在使用以下查询来解析 presto 中的日期:

SELECT date_parse(t.up_date, '%c/%e/%Y %l:%i:%s %p') from table t

样品日期为:4/11/2021 12:30:00 PM

但有时我们会得到不是不能解析"testdate"的日期(任何不是日期的字符串)

如何在查询中跳过此类日期?我的查询应如下所示:

0 投票
1 回答
27 浏览

mysql - RDBMS Resource Usage when Using PrestoDB

When we querying mysql database using presto, is it means that we still using mysql’s resource like cpu or ram or not?. Thank you

0 投票
0 回答
49 浏览

hadoop - 使用 pyspark 从本地计算机连接远程 PrestoDB 时出现问题

我正在尝试使用 pyspark 从我的 mac 本地计算机连接到远程服务器中安装的 presto DB,下面是我的代码。我已经下载了 presto 驱动程序并将其放在 /user/name//Hadoop/spark-2.3.1-bin-hadoop2.7/jars 下(我想这是我犯错的地方,但不确定)

Preso 驱动程序:presto-jdbc-340.jar

当我尝试执行代码时,出现如下错误

知道如何解决这个问题吗?

0 投票
0 回答
121 浏览

sql - Presto 查询失败:语句太大(分析时堆栈溢出)但查询字符串不大

我有一个尝试在 EMR PrestoDB 上运行的查询。它正在读取 s3 胶水 ORC 表。我收到“查询失败:语句太大(分析期间堆栈溢出)”错误,但查询本身并不长,只有 1364 行,它实际上在 Athena 中运行良好,只是当我将它移动到运行时直接在 PrestoDB 上失败。

查询是 1364 行,它是 144kb(下面的例子更短,因为我不得不匿名化一些对象)

我正在通过代理跳转 SSH 从 Datagrip IDE 运行它。我想知道是否可能存在一些http问题?

下面是一个查询示例,尽管查询本身更长,因为 StackOverflow 有 30000 个字符的限制。

) --CTAS 结束

0 投票
2 回答
705 浏览

apache-spark - 在 Spark SQL 中使用 Presto JDBC 时无法识别的连接属性“url”

这是我的 spark sql 代码,我正在尝试根据本指南读取 presto 表;  https://spark.apache.org/docs/latest/sql-data-sources-jdbc.html

  我收到以下异常,unrecognized connection property 'url'

似乎此问题与https://github.com/prestodb/presto/issues/9254 有关,其中该属性url不是 Presto 中公认的属性,并且看起来需要在 Spark 端进行修复?这个问题还有其他解决方法吗?

PS:

0 投票
1 回答
76 浏览

python - 带有presto的GCP dataproc - 有没有办法使用pyhive通过python远程运行查询?

我正在尝试在我在 dataproc 上运行的 presto 集群上运行查询 - 通过本地机器上的 python(使用来自 pyhive 的 presto)。但我似乎无法弄清楚主机 URL。GCP dataproc 甚至允许远程访问 presto 集群吗?

我尝试在 Presto 的 Web UI 上使用 URL,但这也不起作用。我还查看了有关使用 Python 的云客户端库的文档。也没有帮助。https://cloud.google.com/dataproc/docs/tutorials/python-library-example

错误

更新 我能够在 GCP 计算上手动创建一个虚拟机,配置 trino 并设置防火墙规则和负载均衡器,以便能够访问集群。

必须检查 dataproc 是否允许类似的配置。

0 投票
0 回答
46 浏览

python - 使用 Apache Spark 连接到 Presto 时,SQL Exception-Unsupported type JAVA_OBJECT

使用 Apache Spark 连接到 Presto 时不支持类型 JAVA_OBJECT


我正在尝试将 presto sql 查询写入数据框,但出现错误

这适用于简单查询,但在查询中使用 map_from_entries 时会产生问题,如下所示:

我正在使用的代码如下:

我该如何解决这个问题,有没有办法将此查询保存到数据框?

0 投票
0 回答
366 浏览

amazon-s3 - 从 Presto / Trino 连接超时到 Amazon S3

我目前在 AWS 之外有一个 Kubernetes 设置,其中使用 Presto v348 查询驻留在 Amazon S3 中的数据湖。数据以 parquet 文件格式存储。附加组件是 Hive 元存储。

我遇到以下错误,并且在解决潜在问题时不知所措:

这个问题有时会随着更大的查询而出现,并且有趣的是会使系统进入所有后续查询都超时的状态。在某些情况下,在 1/5 的尝试中查询会成功。较小的查询通常工作得很好。大约 10-20 分钟后情况会好转。重启 Presto 并不能解决 10-20 分钟的问题。因此,我怀疑肯定还有另一个问题。

我知道我可能会遇到性能上限这一事实,但事实上只有超时而不是错误并且整个系统无法使用 10-20 分钟这一事实是不可接受的。

我已经增加hive.s3.max-connections了 Presto 和fs.s3a.connection.maximumMetastore 配置中的配置,但它似乎并没有解决问题。除此之外,我没有发现有关如何调整设置以防止错误发生的建议。

Presto 连接器配置:

元数据配置: