0

我正在尝试比较不同数据库中的两个表(或寻找最佳方法)。

数据库一中的表:

id  int(11) 
lastmod int(11) 

数据库二中的表:

id          int(11) 
timestamp   int(11)     

两个表都有匹配的 id(id 在 db1 中不是唯一的。就像一个(db2)到多个(db1))和时间戳(但其他列不同)。但随着时间的推移,数据库二中的记录将被更新(数据在一个不重要的列中)。现在我需要查找记录(时间戳),比较 id,以查找我需要在数据库 1 中更新哪些记录。问题还在于性能,因为两个表都有超过 5 000 000 条记录。查找需要更新的记录的最佳方法(最佳)是什么?

4

1 回答 1

2

假设这id是两个表中的主键,那么以下应该是有效的:

select *
from db1.table t1 join
     db2.table t2
     on t1.id = t2.id and
        t1.lastmod <> t2.timestamp

请注意,这假设了两件事。首先,id在每个表中都是唯一的,其次时间戳列不是NULL

编辑:

如果情况是您有多个修改t1并试图将结果与t2只有一行的结果进行比较,则t1首先聚合以获取最近的修改日期并从那里继续:

select *
from (select t1.id, max(t1.lastmod) as lastmod
      from db1.table t1
      group by t1.id
     ) t1 join
     db2.table t2
     on t1.id = t2.id and
        t1.lastmod <> t2.timestamp

如果您确实要查找在 中具有多个修改的记录t1,则将 a 添加having count(*) > 1到子查询中。

于 2013-07-04T14:30:39.043 回答