mysql - MySQL使用多列选择重复记录

Question

我想从表中选择记录，或者将它们插入到一个新的空白表中，其中多个列与数据库中的另一条记录相同。问题与此问题类似。在 MySQL 中查找重复记录但是只比较一列。另外，我的其中一列，比如下例中的 C 列，是一个整数。就像上面链接中的问题一样，我希望返回每一行。不幸的是，我对连接如何自己解决这个问题还不够熟悉。我知道下面的代码根本不像实际需要的 SQL 代码，这只是我能想到的最清晰的方式来描述我想要得到的比较。

SELECT ColumnE, ColumnA, ColumnB, ColumnC from table where (
  Row1.ColumnA = Row2.ColumnA &&
  Row1.ColumnB = Row2.ColumnB &&
  Row1.ColumnC = Row2.ColumnC
)

任何帮助将不胜感激，我看到的所有“从 MYSQL 中选择重复项”问题仅使用一列作为比较。

score 107 · Accepted Answer

如果要计算多列中的重复项，请使用group by：

select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
from table
group by ColumnA, ColumnB, ColumnC

如果您只想要重复的值，则计数大于 1。您可以使用以下having子句得到：

select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
from table
group by ColumnA, ColumnB, ColumnC
having NumDuplicates > 1

如果您确实希望返回所有重复的行，则将最后一个查询连接回原始数据：

select t.*
from table t join
     (select ColumnA, ColumnB, ColumnC, count(*) as NumDuplicates
      from table
      group by ColumnA, ColumnB, ColumnC
      having NumDuplicates > 1
     ) tsum
     on t.ColumnA = tsum.ColumnA and t.ColumnB = tsum.ColumnB and t.ColumnC = tsum.ColumnC

这将起作用，假设所有列值都不是 NULL。如果是这样，请尝试：

     on (t.ColumnA = tsum.ColumnA or t.ColumnA is null and tsum.ColumnA is null) and
        (t.ColumnB = tsum.ColumnB or t.ColumnB is null and tsum.ColumnB is null) and
        (t.ColumnC = tsum.ColumnC or t.ColumnC is null and tsum.ColumnC is null)

编辑：

如果您有NULL值，您还可以使用NULL-safe 运算符：

     on t.ColumnA <=> tsum.ColumnA and
        t.ColumnB <=> tsum.ColumnB and
        t.ColumnC <=> tsum.ColumnC

score 1 · Accepted Answer

你为什么不尝试使用联合或创建临时表。但就个人而言，我确实建议使用联合而不是创建临时表，因为这样做会花费您更长的时间。尝试这样做：

  select field1, field2 from(
   select '' as field2, field1, count(field1) as cnt FROM list GROUP BY field2 HAVING cnt > 1
    union
    select ''as field1, field2, cound(field2) as cnt from list group by field1 having cnt > 1
  )

希望这是有道理的。:)

mysql - MySQL使用多列选择重复记录

2 回答 2

Related

Reference