3

我只是在我的数据库中添加了一些外键,通常我所有的外键都是不可识别的,因为我从来没有费心让它们识别,因为我从来不知道它们之间的区别,而且我的数据库似乎总是对我来说足够好。

现在我决定我要正确地制作这个数据库,并制作外键识别和非识别。我很好奇他们在进行联接时是否有任何性能差异?

谢谢

4

2 回答 2

4

是的,通过在标识关系上创建外键来连接可能会带来一些性能优势。但这取决于查询(因为优化方法总是这样做)。

例如,查询给定作者的书籍:

SELECT a.author_name, b.book_name
FROM Authors AS a
JOIN AuthorBooks AS ab ON a.author_id = ab.author_id
JOIN Books AS b ON b.book_id = ab.book_id
WHERE a.author_id = 12345;

在这种情况下,我们希望与 AuthorBooks 的连接使用索引。它将使用哪个索引?这取决于我们如何定义该表中的索引。

这两个实体表非常简单。

CREATE TABLE Authors (
  author_id INT AUTO_INCREMENT PRIMARY KEY,
  author_name VARCHAR(50)
);

CREATE TABLE Books (
  book_id INT AUTO_INCREMENT PRIMARY KEY,
  book_name VARCHAR(50)
);

但是开发人员设计多对多表有两种常见的方式。一个主键有一个自动递增的 id:

CREATE TABLE AuthorBooks (
  id INT AUTO_INCREMENT PRIMARY KEY,
  author_id INT NOT NULL,
  book_id INT NOT NULL,
  FOREIGN KEY (author_id) REFERENCES Authors (author_id)
  FOREIGN KEY (book_id) REFERENCES Books (book_id)
);

另一个没有id。主键是两个外键的组合,这使得它们都与各自引用的实体表具有识别关系。

CREATE TABLE AuthorBooks (
  author_id INT NOT NULL,
  book_id INT NOT NULL,
  PRIMARY KEY (author_id, book_id),
  FOREIGN KEY (author_id) REFERENCES Authors (author_id)
  FOREIGN KEY (book_id) REFERENCES Books (book_id)
);

性能上有什么区别?

首先,请记住 MySQL 如何为外键实现索引:如果没有索引,则外键将隐式创建一个。如果列上已有索引,则外键将使用它。即使是包含外键列作为最左列的索引,也可以使用,无需为外键创建新索引。

在第一个 AuthorBooks 表设计中,当 MySQL 执行从 Authors 到 AuthorBooks 的连接时,它在索引中查找 author_id 外键的条目。但是要执行第二次连接,该索引条目必须获取它引用的行,以获取 book_id 值,然后它使用它来连接到 Books 表。所以连接最终需要额外的表查找。

在第二个 AuthorBooks 表设计中,author_id 由表的 PRIMARY KEY 索引。因此,当连接对 author_id 进行查找时,它可以访问匹配的 book_id,而无需对表进行额外的查找。book_id 然后可以用于第二个连接。这消除了查询找到的每一行的一个步骤。

事实证明,这对性能有很大好处。我通过使多对多表使用这样的覆盖索引来优化一些查询——无论是通过使用主键还是在两个外键上创建一个额外的两列索引——这导致最多六个订单性能的大幅度提升。

于 2018-02-18T22:05:05.703 回答
2

@billKarwin 的回答非常好。我只想添加一个观察结果。

识别和非识别关系是逻辑结构。他们为底层业务领域建模 - 请参阅这个问题(也由无处不在的@billKarwin 回答)。使用这样的逻辑结构的原因是为了使数据库更易于理解(因此更易于维护、扩展等)。这不是为了让你的数据库“更快”。

于 2018-02-19T11:21:22.547 回答