我有一些具有相同结构的日志表。每个表都与一个站点相关,并且有数十亿个条目。这种拆分的原因是为了进行快速高效的查询,因为 99.99% 的查询都与站点相关。
但是此时,我想检索这些表的一列的最小值和最大值?
我无法编写 SQL 请求。我应该使用UNION
吗?
我只是在寻找请求概念,而不是最终的 SQL 请求。
我有一些具有相同结构的日志表。每个表都与一个站点相关,并且有数十亿个条目。这种拆分的原因是为了进行快速高效的查询,因为 99.99% 的查询都与站点相关。
但是此时,我想检索这些表的一列的最小值和最大值?
我无法编写 SQL 请求。我应该使用UNION
吗?
我只是在寻找请求概念,而不是最终的 SQL 请求。
您可以使用 UNION,是的。这样的事情应该做:
SELECT MAX(PartialMax) AS TotalMax
FROM
( SELECT MAX(YourColumn) AS PartialMax FROM FirstTable UNION ALL SELECT MAX(YourColumn) AS PartialMax FROM SecondTable ) AS X;
如果您对要在其中找到 MAX 的列有索引,则应该具有非常好的性能,因为查询应该寻找该列上索引的末尾以非常快速地找到最大值。如果该列上没有索引,则查询必须扫描整个表以找到最大值,因为没有任何东西固有地对其进行排序。
添加了一些细节来解决对“巨大查询”的担忧。
我不确定你所说的“巨大”是什么意思。您可以创建一个为您执行 UNION 的 VIEW;然后,您使用视图,它会使查询变得非常小:
SELECT MAX(YourColumn) FROM YourView;
但这只是针对查询文本的大小进行了优化。为什么您认为为此进行优化很重要?VIEW 有助于维护——如果您添加或删除分区,只需适当地修复视图。但是长的查询文本应该不是问题。
或者“巨大”,您是否担心查询将执行的 I/O 量?除了确保每个表都有一个索引YourColumn
以便可以非常快速地找到每个分区上的最大值之外,没有什么能有这么大的帮助。