1

我有一个正在使用的查询,ORDER BY RAND()但它花费的时间太长,而且随着数据的增长它变得更糟。

该查询连接两个表并返回 5 个随机产品和每个产品的随机图像

表 1 - 产品

product_id - pk auto-inc
name 
description

数据

1 - product 1 - description
2 - product 2 - description

表 2 - 产品图片

image_id   - pk auto-inc
product_id - fk index
filename

数据

1 - 1 - product 1 image
2 - 1 - product 1 image
3 - 1 - product 1 image
4 - 2 - product 2 image

...

我已经阅读了这个这个,但找不到优化查询的方法,所以我正在寻求帮助。提前致谢。

4

1 回答 1

5

ORDER BY RAND()很慢,因为 DBMS 必须读取所有行,将它们全部排序,只保留几行。所以这个查询的性能很大程度上取决于表中的行数,并且随着行数的增加而降低。

没有办法优化它。

但是,还有其他选择:

您可以通过执行 6 个查询来实现“获取 5 个随机行” :

  • 获取表中的行数(您可以缓存这一行)
  • 进行 5 次查询OFFSET <random offset from 0 to $number_of_rows-1> LIMIT 1(即从某个随机偏移量读取并仅返回一行)

    例如:(SELECT * FROM Products OFFSET 42 LIMIT 1注:暂时不加入)

    这样的查询非常快,并且运行时间几乎与表大小无关。

这应该.ORDER BY RAND()


现在,要为每个随机产品获取随机图像:

SELECT *
FROM (
    SELECT *
    FROM Products
    OFFSET 42 LIMIT 1
) p
JOIN ProductImages pi
ON   pi.product_id = p.id
ORDER BY RAND()
LIMIT 1

内部查询仍然很快,外部只对几行进行排序(假设每个产品的图像很少),因此仍然可以使用 rand() 排序。

于 2013-05-27T17:22:39.020 回答