我正在尝试创建一个 MySQL 查询,该查询将返回包含一组相关记录中重复值的所有单个行(未分组)。“相关记录组”是指具有相同帐号的那些(根据下面的示例)。
基本上,在共享相同不同帐号的每组相关记录中,仅选择那些其date
或amount
列的值与该帐户记录组中另一行的值相同的行。仅应将值视为该帐户组中的重复值。下面的示例表和理想输出详细信息应该可以解决问题。
此外,我不关心返回状态为 X 的任何记录,即使它们具有重复值。
带有相关数据的小样本表:
id account invoice date amount status
1 1 1 2012-04-01 0 X
2 1 2 2012-04-01 120 P
3 1 2 2012-05-01 120 U
4 1 3 2012-05-01 117 U
5 2 4 2012-04-01 82 X
6 2 4 2012-05-01 82 U
7 2 5 2012-03-01 81 P
8 2 6 2012-05-01 80 U
9 3 7 2012-03-01 80 P
10 3 8 2012-04-01 79 U
11 3 9 2012-04-01 78 U
从所需的 SQL 查询返回的理想输出:
id account invoice date amount status
2 1 2 2012-04-01 120 P
3 1 2 2012-05-01 120 U
4 1 3 2012-05-01 117 U
6 2 4 2012-05-01 82 U
8 2 6 2012-05-01 80 U
10 3 8 2012-04-01 79 U
11 3 9 2012-04-01 78 U
因此,不应同时返回第 7/9 行和第 8/9 行,因为它们的重复值在其各自帐户的范围内不被视为重复值。但是,应该返回第 8 行,因为它与第 6 行共享一个重复值。
稍后,我可能想通过仅抓取具有匹配状态的重复行来进一步完善选择,因此将排除第 2 行,因为它与该帐户记录组中的其他两个不匹配。这会使查询变得更加困难吗?是否只是添加 WHERE 或 HAVING 子句的问题,还是比这更复杂?
我希望我对我要完成的工作的解释是有道理的。我尝试过使用 INNER JOIN ,但这会多次返回每个所需的行。我不想要重复的重复。
表结构和样本值:
CREATE TABLE payment (
id int(11) NOT NULL auto_increment,
account int(10) NOT NULL default '0',
invoice int(10) NOT NULL default '0',
date date NOT NULL default '0000-00-00',
amount int(10) NOT NULL default '0',
status char(1) NOT NULL default '',
PRIMARY KEY (id)
);
INSERT INTO payment VALUES (1, 1, 1, '2012-04-01', 0, 'X');
INSERT INTO payment VALUES (2, 1, 2, '2012-04-01', 120, 'P');
INSERT INTO payment VALUES (3, 1, 2, '2012-05-01', 120, 'U');
INSERT INTO payment VALUES (4, 1, 3, '2012-05-01', 117, 'U');
INSERT INTO payment VALUES (5, 2, 4, '2012-04-01', 82, 'X');
INSERT INTO payment VALUES (6, 2, 4, '2012-05-01', 82, 'U');
INSERT INTO payment VALUES (7, 2, 5, '2012-03-01', 81, 'p');
INSERT INTO payment VALUES (8, 2, 6, '2012-05-01', 80, 'U');
INSERT INTO payment VALUES (9, 3, 7, '2012-03-01', 80, 'U');
INSERT INTO payment VALUES (10, 3, 8, '2012-04-01', 79, 'U');
INSERT INTO payment VALUES (11, 3, 9, '2012-04-01', 78, 'U');