6

我试图了解 MyISAM 如何物理存储其记录以及在记录插入和记录删除后它如何维护其结构。我已阅读以下链接:

我想确定我是否理解正确,如果不正确,请纠正我。

固定大小的记录

MyISAM 固定大小记录

  • 删除标记决定记录是否被删除。
  • 记录标题保存行的哪一列包含 NULL 值
  • 数据的长度是固定的。

可变大小记录

在此处输入图像描述

  • 删除标记替换为 BLOCK_DELETED 块类型
  • 记录头保存数据长度和未使用数据的长度

在此处输入图像描述

  • 一条记录可以分成多个块,通过溢出指针连接。

删除

在此处输入图像描述

  • 对于可变大小的记录,将块类型更改为 BLOCK_DELETED
  • 通过使新删除记录的前一个指针指向最后删除的记录来维护所有已删除记录的双链表。然后,最后一条删除记录的 next 指针指向新删除的记录。
  • 对于固定大小的记录,只需将删除标记更改为已删除。(不确定他们是否使用双链表将所有已删除的记录与固定大小的记录连接起来)

插入

  • 如果没有未使用的空间(已删除的记录),则在文件末尾追加数据
  • 如果有适合新插入记录的未使用空间,则将新记录写入那里。
  • 如果有远大于新插入记录的未使用空间,则分成两条记录:新记录和删除记​​录。
  • 如果有小于新插入记录的未使用空间,则将数据写入那里,并有溢出指针指向其他块的未拟合数据。

更新

  • 如果用户使用更长的数据更新现有数据怎么办?MyISAM 会将记录标记为已删除并找到适合新数据的位置还是简单地使用溢出指针指向不适合的数据?

再次回顾问题

我想确定我是否理解正确,如果不正确,请纠正我。

附加问题

  • 如果表被多次删除和插入,是否会非常低效,因为记录结构可能充满溢出指针和未使用的空间?
4

1 回答 1

5

您在有关 MyISAM 的问题中获得的信息是正确的。但是,我想解决您的另外两个问题:

最新问题

如果用户使用更长的数据更新现有数据怎么办?MyISAM 会将记录标记为已删除并找到适合新数据的位置还是简单地使用溢出指针指向不适合的数据?

根据

sdkm

第 10 章:“存储引擎”第 196 页第 7 段说

对于可变长度的记录,格式更复杂。第一个字节包含描述记录子类型的特殊代码。后续字节的含义因每个子类型而异,但共同的主题是有一个字节序列,其中包含记录的长度、块中未使用的字节数、NULL 值指示标志,以及可能指向的指针如果记录不适合先前创建的空间并且必须拆分,则继续记录。当一条记录被删除并且要插入其位置的新记录超过原始记录的大小时,可能会发生这种情况。您可以通过研究 storage/myisam/mi_dynrec.c 中的 switch 语句 in_mi_get_block_info() 来了解不同代码的含义的详细信息。

根据该段,仅当要插入的新数据无法放入先前分配的块中时,旧记录才会被链接数据覆盖。这可能会导致许多臃肿的行。

附加问题

如果表被多次删除和插入,是否会非常低效,因为记录结构可能充满溢出指针和未使用的空间?

从我之前的回答来看,会有很多块

  • 空间块
  • 记录的长度
  • 块中未使用的字节数
  • NULL 值指示标志
  • 如果记录不适合先前创建的空间并且必须拆分,则可能是指向记录延续的指针

这样的记录链接将从插入过大数据的每一行的前面开始。这会使 MyISAM 表.MYD文件很快膨胀。

建议

MyISAM 的默认行格式是动态的。当一个表是动态的并且经历大量的插入、更新和删除时,这样的表需要使用优化

OPTIMIZE TABLE mytable;

还有一种选择:将表格的行格式切换为固定。这样,所有行的大小都相同。这是使行格式固定的方式:

ALTER TABLE mytable ROW_FORMAT=Fixed;

即使使用固定行格式,也必须花费时间来定位可用记录,但时间将是 O(1) 搜索时间(通俗地说,无论有多少行,定位可用记录都需要相同的时间该表有或有多少已删除的行)。您可以通过启用concurrent_insert来绕过该步骤,如下所示:

将此添加到 my.cnf

[mysqld]
concurrent_insert = 2

不需要重启 MySQL。赶紧跑

mysql> SET GLOBAL concurrent_insert = 2;

这将导致所有 INSERT 转到表的后面而不寻找可用空间。

固定行表的优势

  • 插入、更新和删除会更快一些
  • SELECT 快 20-25%

这是我的一些关于 SELECT 更快的帖子,因为行格式被修复

固定行表的缺点

在大多数情况下,当您运行时ALTER TABLE mytable ROW_FORMAT=Fixed;,表可能会增长 80-100%。文件(MyISAM 表的.MYI索引页)也会以同样的速度增长。

结语

如果您想要 MyISAM 表的速度并且可以使用更大的表,则需要我的替代建议。如果您想为每个 MyISAM 表节省空间,请将行格式保留为(动态)。您将不得不OPTIMIZE TABLE mytable;使用动态表更频繁地压缩表。

于 2013-05-29T20:08:09.553 回答