0

我有一些具有相同结构的日志表。每个表都与一个站点相关,并且有数十亿个条目。这种拆分的原因是为了进行快速高效的查询,因为 99.99% 的查询都与站点相关。

但是此时,我想检索这些表的一列的最小值和最大值?

我无法编写 SQL 请求。我应该使用UNION吗?

我只是在寻找请求概念,而不是最终的 SQL 请求。

4

1 回答 1

2

您可以使用 UNION,是的。这样的事情应该做:

SELECT MAX(PartialMax) AS TotalMax
  FROM 
  ( SELECT MAX(YourColumn) AS PartialMax FROM FirstTable UNION ALL SELECT MAX(YourColumn) AS PartialMax FROM SecondTable ) AS X;

如果您对要在其中找到 MAX 的列有索引,则应该具有非常好的性能,因为查询应该寻找该列上索引的末尾以非常快速地找到最大值。如果该列上没有索引,则查询必须扫描整个表以找到最大值,因为没有任何东西固有地对其进行排序。

添加了一些细节来解决对“巨大查询”的担忧。

我不确定你所说的“巨大”是什么意思。您可以创建一个为您执行 UNION 的 VIEW;然后,您使用视图,它会使查询变得非常小:

SELECT MAX(YourColumn) FROM YourView;

但这只是针对查询文本的大小进行了优化。为什么您认为为此进行优化很重要?VIEW 有助于维护——如果您添加或删除分区,只需适当地修复视图。但是长的查询文本应该不是问题。

或者“巨大”,您是否担心查询将执行的 I/O 量?除了确保每个表都有一个索引YourColumn以便可以非常快速地找到每个分区上的最大值之外,没有什么能有这么大的帮助。

于 2012-12-18T15:36:09.890 回答