0

我们有以下包含大约 1.5 亿行的 MySQL 表:

CREATE TABLE `data` (
  `datetime` datetime NOT NULL,
  `value1` decimal(12,6) NOT NULL,
  `value2` decimal(12,6) NOT NULL,
  `value3` decimal(12,6) NOT NULL,
  `value4` decimal(12,6) NOT NULL,
  `value5` decimal(12,6) NOT NULL,
  `symbol_id` int(11) NOT NULL,
  PRIMARY KEY (`symbol_id`,`datetime`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

这 1.5 亿行平均分布在 9500 个符号之间,由 symbol_id 指定。

我正在尝试在表上运行以下查询:

SELECT datetime FROM data WHERE symbol_id = 1234 AND datetime <= "2013-03-01 15:00:00" ORDER BY datetime DESC LIMIT 1

在查询上运行 EXPLAIN 会返回:

           id: 1
  select_type: SIMPLE
        table: data
         type: range
possible_keys: PRIMARY
          key: PRIMARY
      key_len: 12
          ref: NULL
         rows: 23856
        Extra: Using where; Using index

该查询平均需要大约 300 毫秒才能运行。我可以添加什么索引来加快速度?

谢谢!

4

2 回答 2

2

正如 Gordon 所暗示的,没有可以提高查询性能的索引。

这并不是说您无法使其更快 - 调整您的 DBMS 和 OS I/O - 您没有提供任何关于它当前如何配置、它正在运行什么以及使用模式是什么样的信息。如果你还没有开始这个过程,那么对你的安装运行 mysqltuner.pl 将是一个好的开始——但它并不总是完全正确的。使用不同的引擎可能会提高此查询的性能 - 但这取决于系统上发生的所有其他事情。

通过将索引分片到多个磁盘和/或使用 SSD 作为索引存储,您将获得巨大收益。更多的内存几乎总是有帮助的。

去买一本关于 MySQL 调优的好书,花时间阅读它。

于 2013-03-02T22:44:28.153 回答
0

使用索引可能会提高此查询的性能,但首先您必须确定列的基数。

SELECT COUNT(DISTINCT `datetime`) FROM `data`;
SELECT COUNT(DISTINCT `symbol_id`) FROM `data`;

无论返回最大数量的唯一值具有更高的基数并具有最佳复合索引,列必须按基数的降序排列。

您当前有一个复合主键,其中的列按以下顺序排列。

PRIMARY KEY (`symbol_id`,`datetime`)

如果 symbol_id 具有比 datetime 更高的基数,则无法进一步优化查询。另一方面,如果 datetime 具有更高的基数,那么您应该添加一个带有 datetime 后跟 symbol_id 的索引。

INDEX idx_datetime_symbol (`datetime`,`symbol_id`)
于 2013-03-03T02:09:16.907 回答