1

我试图了解 Redshift 中并发连接和并发查询之间的区别。根据文档,我们可以与 Redshift 集群建立 500 个并发连接,但它说在一个集群中最多可以同时运行 15 个查询。现在确切的值是多少?

  1. 一个集群中可以同时有多少个查询处于运行状态?如果是 15,它是否也包括 RETURNING 状态查询?

  2. 一个集群中可以同时运行多少个 COPY 语句?

我们正在评估 Redshift 作为我们的主要报告数据存储。如果我们不能同时运行大量查询,我们可能很难采用这种模型。

4

1 回答 1

2

我认为,您在某处误读了,每个 WLM 的最大并发查询数为 50。有关更多详细信息,请参阅下面的亚马逊支持响应线程

一个集群中可以同时有多少个查询处于运行状态?如果是 15,它是否也包括 RETURNING 状态查询?

一次最多可以同时运行 50 个查询。是的,它确实包括 INSERT/UPDATE/DELETE 等。

一个集群中可以同时运行多少个 COPY 语句?

理想情况下,您可以同时将 Max 增加到 50,但 Copy 的工作方式略有不同。

Amazon Redshift自动从多个数据文件并行加载。

如果您使用多个并发 COPY 命令从多个文件加载一个表,Amazon Redshift 将被迫执行序列化加载,这会慢得多,并且如果该表定义了一个排序列,则最后需要一个 VACUUM。有关使用 COPY 并行加载数据的更多信息,请参阅从 Amazon S3 加载数据。

这意味着,您可以运行并发Copy命令,但要确保每个表一次复制一个命令。

所以实际上,它不依赖于集群上的节点,但也依赖于表的数量。因此,如果您只有 1 个表,您想同时执行 50 个插入,这将导致同时只有 1 个复制。

于 2018-06-20T09:43:10.813 回答