我有两个类似的表层次结构:
Owner -> OwnerGroup -> Parent
和
Owner2 -> OwnerGroup2
我想根据一组值确定 Owner2 中是否存在完全匹配的所有者。每个 Owner 表中大约有 100 万行。一些 OwnerGroup 最多包含 100 个所有者。
所以基本上,如果有一个 OwnerGroup 包含所有者“Smith”、“John”和“Smith、“Jane”,我想知道完全匹配的 OwnerGroup2 的 id。
第一次尝试是为每个所有者生成一个连接(这需要在应用程序中生成动态 sql:
select og.id
from owner_group2 og
-- dynamic bit starts here
join owner2 o1 on
(og.id = o1.og_id) AND
(o1.given_names = 'JOHN' and o1.surname='SMITH')
-- dynamic bit ends here
join owner2 o2 on
(og.id = o2.og_id) AND
(o2.given_names = 'JANE' and o2.surname='SMITH');
这在少数所有者之前工作得很好,但是当我们必须在一个组场景中处理 100 个所有者时,因为这个查询计划意味着有 100 个嵌套循环,并且需要将近一分钟的时间来运行。
我的另一个选择是在操作员周围使用一些东西intersect
。例如
select * from (
select o.surname, o.given_names
from owner1 o1
join owner_group1 og1 on o1.og_id = og1.id
where
og1.parent_id = 1936233
)
intersect
select o.surname, o.given_names
from owner2 o2
join owner_group2 og2 on og2.id = o2.og_id;
我也不确定如何在这种情况下吸出 owner2.id - 而且它仍在 4-5 秒范围内运行。
我觉得我遗漏了一些明显的东西 - 所以请随时提供一些更好的解决方案!