2

有一个主键为 user_id 的表 users 和一个名为 verify 的索引列。另一个表 user_profile 的 PK 作为 profile_id 和 FK 作为 user_id 并且有一个列 - name

现在,我需要找到所有经过验证的用户及其姓名。所以我需要在 user_id 上加入这两个表 -

查询变为 -

select p.name from user_profile p inner join user u on p.user_id = u.user_id
where u.verified = 1;

profile 表中有 700000 条记录,user 表中有相同数量的记录。上面的这个查询需要 13 秒才能运行。请让我知道,我怎样才能优化运行时间。

MySQL 5.5 版, YII

编辑

CREATE TABLE IF NOT EXISTS `tbl_profile` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `user_id` int(10) unsigned NOT NULL,
  `regyear` int(4) DEFAULT NULL,
  `firstname` varchar(128) NOT NULL,
  `gender` varchar(10) NOT NULL,
  `occupation` int(5) NOT NULL,
  `street` varchar(255) DEFAULT NULL,
  `state` int(10) DEFAULT NULL,
  `city` int(10) DEFAULT NULL,
  `zip` int(10) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `user_id` (`user_id`),
  KEY `state` (`state`),
  KEY `firstname` (`firstname`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 AUTO_INCREMENT=626494 ;

--

-- 表的表结构tbl_user

CREATE TABLE IF NOT EXISTS `tbl_user` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `email` varchar(255) DEFAULT NULL,
  `password` varchar(128) NOT NULL,
  `createtime` int(10) NOT NULL DEFAULT '0',
  `lastvisit` int(10) NOT NULL DEFAULT '0',
  `status` int(1) NOT NULL DEFAULT '0',
  `verified` int(1) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`),
  UNIQUE KEY `email` (`email`),
  KEY `status` (`status`),
  KEY `verified` (`verified`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 AUTO_INCREMENT=626494 ;

EXPLAIN SELECT 的输出 - 我编写了与上述相同的查询,但将 999 替换为 1 并使用列状态而不是已验证,这相当于问题陈述。

EXPLAIN SELECT p.firstname
FROM tbl_profile p
INNER JOIN tbl_user u ON p.user_id = u.id
WHERE u.status =999
+----+-------------+-------+------+----------------+---------+---------+-------------+--------+-------------+
| id | select_type | table | type | possible_keys  | key     | key_len | ref         | rows   | Extra       |
+----+-------------+-------+------+----------------+---------+---------+-------------+--------+-------------+
|  1 | SIMPLE      | u     | ref  | PRIMARY,status | status  | 4       | const       | 313333 | Using index |
|  1 | SIMPLE      | p     | ref  | user_id        | user_id | 4       | newone.u.id |      1 |             |
+----+-------------+-------+------+----------------+---------+---------+-------------+--------+-------------+
4

2 回答 2

2

建议一

添加索引(user_id, first_name)将提高此特定查询的效率:

ALTER TABLE tbl_profile
  ADD INDEX user_id_first_name_IX             -- just a name for the index
    (user_id, first_name) ; 

但是,如果您也有类似的查询,您正在选择其他列,您将需要更多这样的索引。并且在表中添加 5-10 个索引并不算太糟糕(它只会稍微减慢您的插入速度。)但是添加太多索引最终会有害。


建议二

如果每个用户最多有 1 个配置文件,则不需要id在 table 中自动递增profiles。我建议您删除该列并user_id设置主键。我也会将其设为外键:

ALTER TABLE tbl_profile
  DROP PRIMARY KEY,
  DROP COLUMN id,
  ADD CONSTRAINT profile_PK
    PRIMARY KEY (user_id),
  ADD CONSTRAINT user_profile_FK 
    FOREIGN KEY (user_id)
    REFERENCES tbl_user (id) ; 

这比建议 1 好得多,因为您基本上会创建user_id表的聚集索引。用于此表连接的任何查询user_id都将能够使用此(主索引和聚集索引)。

于 2013-05-05T21:08:39.580 回答
-1

ON您可以通过将条件移动到联接子句中来获得性能改进:

select p.name
from user_profile p
join user u on p.user_id = u.user_id and u.verified = 1;

它可能表现更好的原因是在所有行都连接WHERE评估子句- 它是结果集的过滤器。但是,在进行连接时会评估条件,因此数据库可能必须处理更少的行,从而减少内存/资源。ON

除了那个改变,我看不出你还能做什么。

于 2013-05-05T21:10:47.707 回答