我在 MySQL DB 中有一个带有 UNIQUE INT(10) 列的表。该表非常填充,并且该行包含该列中整数的非连续条目。我想做一个查询,得到不在任何行中的最小数字(或 n 个最小数字)。
示例:该表包含具有列值(1, 2, 3, 5, 7, 8, 10, 12, 15)
的行。sql 语句应该返回即五个最低的非包含值,4, 6, 9, 11, 13
在这种情况下是。
这对 MySQL 可行吗?
我在 MySQL DB 中有一个带有 UNIQUE INT(10) 列的表。该表非常填充,并且该行包含该列中整数的非连续条目。我想做一个查询,得到不在任何行中的最小数字(或 n 个最小数字)。
示例:该表包含具有列值(1, 2, 3, 5, 7, 8, 10, 12, 15)
的行。sql 语句应该返回即五个最低的非包含值,4, 6, 9, 11, 13
在这种情况下是。
这对 MySQL 可行吗?
您可以使用“数字”表(对各种操作都很方便):
CREATE TABLE num
( i UNSIGNED INT NOT NULL
, PRIMARY KEY (i)
) ;
INSERT INTO num (i)
VALUES
(1), (2), ..., (1000000) ;
然后:
SELECT
num.i
FROM
num
LEFT JOIN
tableX AS t
ON num.i = t.columnX
WHERE
t.columnX IS NULL
ORDER BY
num.i
LIMIT 5
或者:
SELECT
num.i
FROM
num
WHERE
NOT EXISTS
( SELECT *
FROM tableX AS t
WHERE num.i = t.columnX
)
ORDER BY
num.i
LIMIT 5
另一种不使用辅助表的方法是使用 MySQL 变量。您可以在SQL-Fiddle test-2中对其进行测试。输出和前面不一样(只是为了说明可以做到):
SELECT start_id, end_id
FROM
( SELECT
IF( t.columnX <> @id, @id, NULL) AS start_id
, IF( t.columnX <> @id, t.columnX-1, NULL) AS end_id
, @rows := @rows + (t.columnX - @id) AS r
, @id := t.columnX + 1 AS running_id
FROM
tableX AS t
CROSS JOIN
( SELECT @rows := 0
, @id := 1
) AS dummy
WHERE
@rows < 5
ORDER BY
t.columnX
) AS tmp
WHERE
start_id IS NOT NULL
这会起作用,但我认为它的效率很低。不过,您不需要额外的表(一个(2^31-1)*4/1024^3 = 8GB
用于 INT 中所有正数的表)。另外我建议你看看你为什么需要这个,因为它可能不是必需的。
它还将返回一个范围的开始和结束,但不是该范围内的所有数字。(例如,如果您有数字 1 和 5,它将返回 {0,2,4,6})
SELECT (t.num-1) AS bound FROM t
WHERE t.num-1 NOT IN (SELECT t.num FROM t)
UNION
SELECT (t.num+1) AS bound FROM t
WHERE t.num+1 NOT IN (SELECT t.num FROM t)
正如我所说,这将非常低效,JOIN 可能会更快,但您需要对其进行基准测试。
SELECT (t.num-1) AS bound FROM t
LEFT JOIN t AS u ON t.num-1 = u.num
WHERE u.num IS NULL
UNION
SELECT (t.num+1) AS bound FROM t
LEFT JOIN t AS u ON t.num+1 = u.num
WHERE u.num IS NULL