php - 使用外键合并两个数据库时的 SQL 问题

Question

我在工作区 A 和工作区 B 有一个数据库。在线有这个数据库的副本，它总是从两个工作区更新。此外，每当另一个工作区进行任何更改时，两个工作区都可能需要更新其数据库。

一切都运行良好，但我的问题是：例如有 2 个表Stock，Orders其中Orders有一列是stock_id.

如果工作区 A 创建一个具有自动递增“stock_id”=23 的新“Stock X”，并且工作区 B 创建一个具有自动递增“stock_id”=23 的新“Stock Y”，则工作区 B 将添加工作区 A 的“Stock X”并且工作区 B 将添加工作区 B 的“库存 Y”，但每个数据库中的每个都有不同的 id。

当工作区A在stock_id = 23即“Stock X”上下订单时会出现问题，当此查询发送到中央数据库，然后发送到工作区B时，它将插入订单，但stock_id = 23将引用“敦实”。

我真的很感谢一些帮助谢谢:)

score 2 · Accepted Answer

如果工作区 A 和 B 每个都有不同的 ID 23 条目，那么您唯一的选择是在将记录更新到中央数据库时为每个条目创建一个辅助键。然后，当您更新它们时，可以将该密钥重新复制回工作区数据库，这将允许使用真正唯一的标识符访问它们的项目。

但是，我强烈建议您不要使用此方法！

正确的做法是创建一个用于工作区 1 和 2 的 Web 或桌面应用程序，该应用程序将连接到中央数据库并将其用于所有数据访问。良好的数据库设计通常意味着尽可能少地复制数据。通过在三个不同的数据库中运行多个订单、库存等副本，您正在为将来的数据损坏和/或丢失做好准备——随着数据库的增长，这个问题只会变得越来越难以修复尺寸。在数据库变得更大之前修复结构问题！

score 2 · Accepted Answer

编辑：

您的原始设计使用AUTO INCREMENT列作为主键。这样做的问题是，正如您所看到的，当您将数据同时进入最终将合并的单独数据库时，您最终会创建重复的键。

一种替代方法是在每个不同的数据库中使用一个序列。不幸的是，序列在 mysql 中本身并不可用（许多其他数据库，如 Oracle、db2 确实有它们——它们允许这种类型的分布式数据库插入而不会发生冲突）。 AUTO INCREMENT列不允许您想要的复制类型。

所以，你有两个选择。

1）添加设置 location_id 的主键的额外部分（根据第一个答案）。

2）或者使用您自己的序列手动为您的插入生成您的ID，而不是使用AUTO INCREMENT列。

最好将序列实现为存储的过程/函数，当它获得序列中的下一个值时提交自身——这可能最终导致值不被使用。这很好——如果你要等到整个插入提交之前提交一个序列号，这比争用要好。

主要的是，当您进行第一次插入时，您使用存储过程中的序列 #。当您有效地将数据复制到第二个数据库中时，您可以在原始数据库的行中使用生成的序列 #。并且序列将在每个单独的数据库中维护，并具有不同的起点，以防止冲突。

例如，在每个数据库中，您需要两个部分：

1) 一个表，其中包含每个命名序列的下一个可用序列号。（每个从序列中获取主键的表都会得到一个条目）。2) 使用下一个序列号访问和更新该表的函数。

一个示例实现将是：

序列表：

CREATE TABLE sequences (
  name varchar(30) NOT NULL,
  value int(10) unsigned,
  PRIMARY KEY (name)
) ENGINE=InnoDB

序列函数：

delimiter //
create function get_next_value(p_name varchar(30)) returns int
  deterministic
  sql security invoker
begin
  declare current_val integer;
    UPDATE sequences
    SET value = (@current_val:=value) + 1
    WHERE name = p_name;

  return @current_val;
end //
delimiter ;

主要问题是存储的函数需要是单个语句，以便它完成并因此立即提交（否则，您将锁定它，这将导致您的事务在订单进入时相互堆叠。如果您没有很高的吞吐量，这不是什么大问题。

这个函数不是我写的——我是从这里随意复制的：http: //www.bigdbahead.com/? p=185 我会向你推荐，以获取更多详细信息。（如果那个用户在这里找到我，我很乐意让他写一个答案并在这里给他适当的信用）。

现在，对于每个数据库，您使用不同的数字初始化值以避免冲突。因此，对于orders位置 A 中的表，您可以使用以下命令对其进行初始化：

insert into sequences ('orders', 1);

在位置 B，您将使用以下命令对其进行初始化：

insert into sequences ('orders', 1000000);

然后在两个数据库中，在插入orders时，你会这样做：

insert into orders (order_id, . . .)
select mysql.get_next_value('user_id'), . . . <hardcoded-values>

--

我还没有对这个解决方案进行路试——把它作为我在关于序列的回答中所建议的内容的大纲。您应该跟进上面的博客条目链接，它提供了更多详细信息，特别是关于如何在事务控制下工作，请参阅评论（我从评论中获取了函数的形式，而不是原始函数），当然，在负载下测试它。

score 0 · Accepted Answer

我想到了这个答案，但我仍然很困惑，如果它比上面的其他解决方案更好。工作区 B 中的所有查询都在本地数据库上立即执行，也发送到中央数据库，然后发送到工作区 A，但是工作区 A 上的查询不会立即在本地数据库上执行，它们被发送到中央数据库然后中央数据库将它们发送到工作区 B，当工作区 B 执行这些查询时，它会通知中央，然后通知工作区 A，然后它可以执行存储的查询。因此，工作区 B 可以正常执行其查询，但工作区 A 仅在知道工作区 B 何时执行这些查询时才允许执行其查询，因为在工作区 B 执行 A 的查询之前，它会发送自己的新查询查询，然后执行 A 的查询，所以在 A 被通知 B 执行了它的查询之后，它检查 B 是否发送了它自己的任何新查询并执行它们，然后它执行它自己的查询。这样，所有自动递增的 id 在两个工作区中都是相同的。例子：

工作区 A：

         q1= insert into stock (name) values ('A')    not executed

         q2= insert into stock (name) values ('B')    not executed

A的数据库：（空）

工作区 A 将 q1 和 q2 发送到中央，正在等待中央确认 B 已执行这些查询，以便它可以自己执行它们

工作区 B：

         q3= insert into stock (name) values ('C')    executed id=1

         q4= insert into stock (name) values ('D')    executed id=2

B 的数据库： (1,'C') , (2,'D')

Workspace B 将 q3 & q4 发送到 central 后，收到 q1 和 q2 的通知，

工作区 B 执行 q1 & q2

          q1= insert into stock (name) values ('A')   executed id=3

          q2= insert into stock (name) values ('B')   executed id=4

数据库 B: (1,'C') , (2,'D'), (3,'A') , (4,'B')

工作区 A 被通知 B 已经执行了它的 q1 & q2，但它被告知它必须先执行 q3 & q4 才能执行 q1 & q2

工作区 A：

          q3= insert into stock (name) values ('C')    executed id=1

          q4= insert into stock (name) values ('D')    executed id=2

          q1= insert into stock (name) values ('A')    executed id=3

          q2= insert into stock (name) values ('B')    executed id=4

B 的数据库： (1,'C') , (2,'D'), (3,'A') , (4,'B')

php - 使用外键合并两个数据库时的 SQL 问题

3 回答 3

Related

Reference