我需要一个查询来遍历数据库中的每个条目,检查单个值是否在数据库的其他地方重复,如果是 - 删除两个条目(或全部,如果超过两个)。
问题是条目是 URL,最多 255 个字符,无法识别行。由于性能限制,Stack Overflow 上的一些现有答案对我不起作用,或者它们使用的 uniqueid 在处理字符串时显然不起作用。
长版:
我有两个包含 URL(并且只有 URL)的数据库。一个数据库有大约 3,000 个网址,另一个有大约 1,000 个。
但是,这 1,000 个 url 中的大部分来自 3,000 url 数据库。我只需要将 1,000 合并到 3,000 作为新条目。
为此,我创建了第三个数据库,其中包含来自两个表的 URL 组合,大约 4,000 个条目。我需要在这个数据库中找到所有重复的条目并删除它们(它们都没有离开)。
我已经按照这个站点上的几个示例的查询,但是每当我尝试删除这两个条目时,它最终都会删除所有条目,或者给出 sql 错误。
或者:我有两个数据库,每个数据库都包含单独的数据库。我需要检查一个数据库中的每一行,以找到不重复的任何行,然后将它们添加到第三个数据库中。