19

我想按日期时间列对 mysql 表进行分区。一天一个分区。创建表的脚本是这样的:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
PARTITION BY hash (day(ftime)) partitions 31;

但是当我选择某天的数据时,它找不到分区。选择语句是这样的:

explain partitions select * from raw_log_2011_4 where day(ftime) = 30;

当我使用另一个语句时,它可以找到分区,但我不能选择某一天的数据。

explain partitions select * from raw_log_2011_4 where ftime = '2011-03-30';

有没有人告诉我如何选择某一天的数据并利用分区。谢谢!

4

4 回答 4

25

HASH 分区对于 datetime 列是一个非常糟糕的主意,因为它不能使用partition pruning。来自 MySQL 文档:

修剪只能用于按 HASH 或 KEY 分区的表的整数列。例如,表 t4 上的此查询不能使用修剪,因为 dob 是 DATE 列:

SELECT * FROM t4 WHERE dob >= '2001-04-14' AND dob <= '2005-10-15';

但是,如果表将年份值存储在 INT 列中,则可以修剪具有 WHERE year_col >= 2001 AND year_col <= 2005 的查询。

因此,您可以将 TO_DAYS(DATE()) 的值存储在一个额外的 INTEGER 列中以使用修剪。

另一种选择是使用 RANGE 分区:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
  PARTITION BY RANGE( TO_DAYS(ftime) ) (
    PARTITION p20110401 VALUES LESS THAN (TO_DAYS('2011-04-02')),
    PARTITION p20110402 VALUES LESS THAN (TO_DAYS('2011-04-03')),
    PARTITION p20110403 VALUES LESS THAN (TO_DAYS('2011-04-04')),
    PARTITION p20110404 VALUES LESS THAN (TO_DAYS('2011-04-05')),
    ...
    PARTITION p20110426 VALUES LESS THAN (TO_DAYS('2011-04-27')),
    PARTITION p20110427 VALUES LESS THAN (TO_DAYS('2011-04-28')),
    PARTITION p20110428 VALUES LESS THAN (TO_DAYS('2011-04-29')),
    PARTITION p20110429 VALUES LESS THAN (TO_DAYS('2011-04-30')),
    PARTITION future VALUES LESS THAN MAXVALUE
  );

现在以下查询将只使用分区 p20110403:

SELECT * FROM raw_log_2011_4 WHERE ftime = '2011-04-03';
于 2013-10-18T14:19:15.610 回答
11

嗨,您在表定义中做了错误的分区,表定义如下:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
PARTITION BY hash (TO_DAYS(ftime)) partitions 31;

您的选择命令将是:

explain partitions 
    select * from raw_log_2011_4 where TO_DAYS(ftime) = '2011-03-30';

上面的命令将选择所有需要的日期,就像你使用 TO_DAYS 命令一样

mysql> SELECT TO_DAYS(950501);
        -> 728779
mysql> SELECT TO_DAYS('2007-10-07');
        -> 733321

为什么要使用 TO_DAYS AS MySQL 优化器将识别两个基于日期的函数来进行分区修剪: 1.TO_DAYS() 2.YEAR()

这将解决你的问题..

于 2011-05-28T18:39:12.093 回答
2

我最近在http://dev.mysql.com/tech-resources/articles/mysql_55_partitioning.html上阅读了一篇与此相关的 MySQL 博客文章。

早于 5.1 的版本需要特殊的体操才能根据日期进行分区。上面的链接讨论了它并显示了示例。

5.5 及更高版本允许您使用非数字值(例如日期和字符串)进行直接分区。

于 2011-10-25T21:40:12.583 回答
0

不使用CHAR,使用VARCHAR。这将节省大量空间,从而减少 I/O,从而加快查询速度。

reporterip: (46) 对于 IP 地址来说是不必要的大,即使是 IPv6。有关进一步讨论,请参阅我的博客,包括如何将其缩小到 16 个字节。

PARTITION BY RANGE(TO_DAYS(...))正如@Steyx 建议的那样,但分区不超过 50 个。尽管进行了“修剪”,但您拥有的分区越多,查询速度就越慢。 HASH分区基本上是无用的。

更多关于分区的讨论,尤其是您正在查看的类型。这包括随着时间的推移一组滑动分区的代码。

于 2015-11-26T04:39:14.127 回答