mysql - 视图上的性能问题 MYSQL SELECT

Question

我正面临 MYSQL 的 SELECT 性能问题。

我有两个表“域”和“电子邮件”，其中包含重复项，这些表经常由不同的来源更新（插入/删除）（大约每十分钟一次）。

我的主要目标是从这些表中创建两个视图，而没有任何重复。我知道视图是一个存储查询，但这是我保持它动态的唯一方法，每十分钟创建一个不重复的新表会很疯狂（也许不是？）。

另一个线程（后缀）使用这两个视图来检查收件人是否是允许的。当我尝试做一个简单的查询

SELECT email FROM emailview WHERE email = 'john@google.com'`

查询需要 3-4 秒。相反，如果我直接在电子邮件表（包含重复项）上执行 SELECT，则需要 0.01 秒。

我怎样才能提高我系统上的 SELECT 性能，以获得几乎与视图相似的结果，而不是直接在表上？

这是架构的详细信息（INNODB 引擎，值 1 是随机的，并不重要）：

域表：

| field        | type         | null | key  |
|--------------|--------------|------|------|
| domain       | varchar(255) | NO   | NULL |
| creationdate | datetime     | NO   | NULL |
| value 1      | varchar(255) | NO   | NULL |
| source_fkey  | varchar(255) | MUL  | NULL |

| domain     | creationdate        | value 1 | source_fkey |
|------------|---------------------|-----------------------|
| google.com | 2013-05-28 15:35:01 | john    | Y           |
| google.com | 2013-04-30 12:10:10 | patrick | X           |
| yahoo.com  | 2011-04-02 13:10:10 | britney | Z           |
| ebay.com   | 2012-02-12 10:48:10 | harry   | Y           |
| ebay.com   | 2013-04-15 07:15:23 | bill    | X           |

域视图（使用最早的创建日期删除重复域）：

CREATE VIEW domainview AS 
  SELECT domain.domain, creationdate, value1, source_fkey 
    FROM domain 
    WHERE (domain, creationdate) IN (SELECT domain, MIN(creationdate) 
                                       FROM domain GROUP BY domain);

| domain     | creationdate        | value 1 | source_fkey |
|------------|---------------------|-----------------------|
| google.com | 2013-04-30 12:10:10 | patrick | X           |
| yahoo.com  | 2011-04-02 13:10:10 | britney | Z           |
| ebay.com   | 2012-02-12 10:48:10 | harry   | Y           |

电子邮件表：

| field        | type         | null | key  |
|--------------|--------------|------|------|
| email        | varchar(255) | NO   | NULL |
| source_fkey  | varchar(255) | MUL  | NULL |


| email              | foreign_key |
|--------------------|-------------|
| john@google.com    | X           |
| john@google.com    | Y           |   <-- duplicate from wrong foreign/domain
| harry@google.com   | X           |
| mickael@google.com | X           |
| david@ebay.com     | Y           |
| alice@yahoo.com    | Z           |

电子邮件视图（来自域视图的域/foreign_key 的合法电子邮件和电子邮件）：

CREATE VIEW emailview AS 
  SELECT email.email, email.foreign_key 
    FROM email, domainview 
    WHERE email.foreign_key = domainview.foreign_key 
      AND SUBSTRING_INDEX(email.email,'@',-1) = domainview.domain;

| email              | foreign_key |
|--------------------|-------------|
| john@google.com    | X           |
| harry@google.com   | X           |
| mickael@google.com | X           |
| david@ebay.com     | Y           |
| alice@yahoo.com    | Z           |

没有唯一性，没有索引，唯一的主键在foreign_key所在的表中。

感谢帮助。

以前的讨论：从特定字符串/键中选择不重复

score 0 · Accepted Answer

两个查询都很慢——首先是因为IN子句中的子选择——直到 MySQL 5.6 才优化；第二个因为在 where 子句中使用了一个函数。

在第一个查询中，您可以用连接替换子选择。第二个，最好将域存储在单独的列中并用于比较

确保在连接、where 和 group by 子句中使用的字段上有复合索引

mysql - 视图上的性能问题 MYSQL SELECT

1 回答 1

Related

Reference