对于一个项目,我需要跟踪大量变量。它需要被记录,哪个用户更改了哪个变量等。该表看起来(简化为一种变量类型)像这样(id 是一个替代键,用于区分版本化条目):
id | variable_id | change_time | change_user | change_task | revision | value
1 1 some date 1 123 1 Hello World
2 2 some date 1 123 1 22.5
3 1 some date 2 456 2 Foo Bar
要检索最新的修订集(此处为条目 2 和 3),我使用此处描述的解决方案: 检索每个组中的最后一条记录
结果查询如下所示:
SELECT
v1.id,
v1.value
FROM
variable_history AS v1
LEFT JOIN
variable_hisotry AS v2
ON
(
v1.variable_id = v2.variable_id AND
v1.revision < v2.revision
)
WHERE
v2.id IS NULL
现在我需要修改该查询,以便适用以下规则:
- 查询最新变量应返回第 2 行和第 3 行
- 查询任务 456的最新变量应返回第 2 行和第 3 行
- 查询任务 123的最新变量应返回第 1 行和第 2 行(出于历史目的)
棘手的是,并非每个任务都一直在更改(更新)所有变量,所以我不能简单地查询任务 X 的所有变量。相反,我必须为任务 X 获取变量,如果有的话,但对于所有其他变量,来自 ANY task < X 但具有最高修订版本的变量。(并排除后期任务的修订)
对于任何情况,结果都应包含所有变量。所以在这个小例子中,它总是应该有 2 行。
编辑:
查询
SELECT
v1.id,
v1.value
FROM
(SELECT * FROM variable_history WHERE change_task <= 123) AS v1
LEFT JOIN
(SELECT * FROM variable_history WHERE change_task <= 123) AS v2
ON
(
v1.variable_id = v2.variable_id AND
v1.revision < v2.revision
)
WHERE
v2.id IS NULL
按预期工作。然而,每天有大约 10.000 个条目,我不满意双子选择,然后是一个连接......
http://sqlfiddle.com/#!2/cfda03/2
编辑:嗯,另一方面:variable_history 的每一行也绑定到一个 entity_id 和 ofc。将 2 个子选择限制为一个有问题的实体会将表大小减少到某处。像150个不同的变量......所以不应该是一个性能问题。