4

我有一个生产数据库,其中偶尔需要“合并”单个表中的冗余行。

假设此表中的两行具有相同的值,但它们的 ID 除外。

Table "PrimaryStuff"
ID | SomeValue
1  | "I have value"
2  | "I have value"
3  | "I am different"

我们还假设存在许多相关的表。因为在“PrimaryStuff”表中创建了重复项,所以通常在这些子表中创建的行都应该与 PrimaryStuff 表上的单个记录相关。 这些表的数量和名称不在我的控制范围内,应在运行时动态考虑。IE:我不知道相关记录的名称甚至数量,因为其他人可能会在我不知情的情况下编辑数据库。

Table "ForeignStuff"
ID | PrimaryStuffId | LocalValue
1| 1| "I have the correct FK"
2| 1| "I have the correct FK"
3| 2| "I should get pointed to an FK of 1"

为了解决 PrimaryStuff 的第 1 行和第 2 行的重复问题,我希望所有相关的表将它们的 FK 更改为 1,然后删除 PrimaryStuff 的第 2 行。这应该是微不足道的,好像 PrimaryStuff 的第 1 行不存在,我可以更新第 2 行到第 1 行的主键,更改将级联。我不能这样做,因为那将是 PrimaryStuff 的唯一索引中的重复键。

随时提出问题,我会尽力解决任何令人困惑的问题。

4

2 回答 2

2

首先让我们获取需要更新的行列表(据我了解,您希望最低 ID 替换所有较高 ID)

 SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
        ID,
        SOMEVALUE
 FROM PrimaryStuff

我们可以删除 FirstID 和 ID 匹配的那些,这些无关紧要

SELECT FirstID, ID FROM
(
 SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
        ID,
        SOMEVALUE
 FROM PrimaryStuff
) T
WHERE FirstID != ID

现在我们有一个更改列表。我们可以在更新语句中使用它,把它放在一个临时表中(或者我在下面做的 CTE):

WITH ChangeList AS
(
  SELECT FirstID, ID FROM
  (
   SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID,
        ID
   FROM PrimaryStuff
  ) T
  WHERE FirstID != ID
)
UPDATE ForeignStuff
SET PrimaryStuffId = ChangeList.FirstID
FROM ForeignStuff
JOIN ChangeList ON ForeignStuff.ID = ChangeList.ID

NB - 代码未经测试,可能有错别字。

于 2013-09-17T15:38:00.010 回答
1

您能否更主动一些,或者在 SomeValue 已经存在时使用现有 ID 并对 PrimaryStuff.SomeValue 强制执行唯一约束,或者为什么不将 SomeValue 作为 PrimaryStuff 的主键。将它作为 PrimaryKey 之后,如果 SomeValue 中尚不存在,则您只会将记录添加到 PrimaryStuff 中。

最后,也是最简单的,如果 SomeValue 总是被别人任意定义,而你拿走他们给你的任何东西,为什么不干脆完全放弃 PrimaryStuff,让用户在 ForeignStuff 中输入他们想要的任何东西呢?如果您需要 SomeValue 的唯一列表,请根据您的主表创建一个视图。如果您需要加快查询速度,请向 ForeignStuff.SomeValue 字段添加索引。

当有多个表(如 ForeignStuff)时,这是一个(未经测试的)视图:

-- dynamically generate a distinct list of values of interest
select SomeValue from ForeignStuffA
union select SomeValue from ForeignStuffB
union select SomeValue from ForeignStuffC
-- and so on, the union applies distinct
于 2013-09-17T15:48:23.940 回答