问题标签 [presto-jdbc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
presto - presto 查询以通过正则表达式模式检索表
想要使用 presto sql 根据特定名称获取表名。
数据库中的示例表:Tiggered_prod:
预期结果:
sql - 类似的方法,比如 presto 中的 TRY_CAST
在 SQL Server 中,有 TRY_CAST 方法可用于检查是否可以进行强制转换。如果强制转换是不可能的,那么它将设置 NULL 作为值。
presto 中是否有类似的方法可用?或者如何在 presto 中实现类似的行为?
sql - 跳过格式错误的日期解析 presto
我正在使用以下查询来解析 presto 中的日期:
SELECT date_parse(t.up_date, '%c/%e/%Y %l:%i:%s %p') from table t
样品日期为:4/11/2021 12:30:00 PM
但有时我们会得到不是不能解析"testdate"
的日期(任何不是日期的字符串)
如何在查询中跳过此类日期?我的查询应如下所示:
mysql - RDBMS Resource Usage when Using PrestoDB
When we querying mysql database using presto, is it means that we still using mysql’s resource like cpu or ram or not?. Thank you
hadoop - 使用 pyspark 从本地计算机连接远程 PrestoDB 时出现问题
我正在尝试使用 pyspark 从我的 mac 本地计算机连接到远程服务器中安装的 presto DB,下面是我的代码。我已经下载了 presto 驱动程序并将其放在 /user/name//Hadoop/spark-2.3.1-bin-hadoop2.7/jars 下(我想这是我犯错的地方,但不确定)
Preso 驱动程序:presto-jdbc-340.jar
当我尝试执行代码时,出现如下错误
知道如何解决这个问题吗?
sql - Presto 查询失败:语句太大(分析时堆栈溢出)但查询字符串不大
我有一个尝试在 EMR PrestoDB 上运行的查询。它正在读取 s3 胶水 ORC 表。我收到“查询失败:语句太大(分析期间堆栈溢出)”错误,但查询本身并不长,只有 1364 行,它实际上在 Athena 中运行良好,只是当我将它移动到运行时直接在 PrestoDB 上失败。
查询是 1364 行,它是 144kb(下面的例子更短,因为我不得不匿名化一些对象)
我正在通过代理跳转 SSH 从 Datagrip IDE 运行它。我想知道是否可能存在一些http问题?
下面是一个查询示例,尽管查询本身更长,因为 StackOverflow 有 30000 个字符的限制。
) --CTAS 结束
apache-spark - 在 Spark SQL 中使用 Presto JDBC 时无法识别的连接属性“url”
这是我的 spark sql 代码,我正在尝试根据本指南读取 presto 表; https://spark.apache.org/docs/latest/sql-data-sources-jdbc.html
我收到以下异常,unrecognized connection property 'url'
似乎此问题与https://github.com/prestodb/presto/issues/9254 有关,其中该属性url
不是 Presto 中公认的属性,并且看起来需要在 Spark 端进行修复?这个问题还有其他解决方法吗?
PS:
python - 带有presto的GCP dataproc - 有没有办法使用pyhive通过python远程运行查询?
我正在尝试在我在 dataproc 上运行的 presto 集群上运行查询 - 通过本地机器上的 python(使用来自 pyhive 的 presto)。但我似乎无法弄清楚主机 URL。GCP dataproc 甚至允许远程访问 presto 集群吗?
我尝试在 Presto 的 Web UI 上使用 URL,但这也不起作用。我还查看了有关使用 Python 的云客户端库的文档。也没有帮助。https://cloud.google.com/dataproc/docs/tutorials/python-library-example
错误
更新 我能够在 GCP 计算上手动创建一个虚拟机,配置 trino 并设置防火墙规则和负载均衡器,以便能够访问集群。
必须检查 dataproc 是否允许类似的配置。
python - 使用 Apache Spark 连接到 Presto 时,SQL Exception-Unsupported type JAVA_OBJECT
使用 Apache Spark 连接到 Presto 时不支持类型 JAVA_OBJECT
我正在尝试将 presto sql 查询写入数据框,但出现错误
这适用于简单查询,但在查询中使用 map_from_entries 时会产生问题,如下所示:
我正在使用的代码如下:
我该如何解决这个问题,有没有办法将此查询保存到数据框?
amazon-s3 - 从 Presto / Trino 连接超时到 Amazon S3
我目前在 AWS 之外有一个 Kubernetes 设置,其中使用 Presto v348 查询驻留在 Amazon S3 中的数据湖。数据以 parquet 文件格式存储。附加组件是 Hive 元存储。
我遇到以下错误,并且在解决潜在问题时不知所措:
这个问题有时会随着更大的查询而出现,并且有趣的是会使系统进入所有后续查询都超时的状态。在某些情况下,在 1/5 的尝试中查询会成功。较小的查询通常工作得很好。大约 10-20 分钟后情况会好转。重启 Presto 并不能解决 10-20 分钟的问题。因此,我怀疑肯定还有另一个问题。
我知道我可能会遇到性能上限这一事实,但事实上只有超时而不是错误并且整个系统无法使用 10-20 分钟这一事实是不可接受的。
我已经增加hive.s3.max-connections
了 Presto 和fs.s3a.connection.maximum
Metastore 配置中的配置,但它似乎并没有解决问题。除此之外,我没有发现有关如何调整设置以防止错误发生的建议。
Presto 连接器配置:
元数据配置: