23

参考这篇文章,有一行写着:

因为操作系统可以寻址的块或驱动器地址的数量是有限的。通过将一个块定义为多个扇区,操作系统可以在不增加块地址数量的情况下使用更大的硬盘驱动器。

这是什么意思?“操作系统可以寻址”是什么意思?随后的数学也不清楚。64*512怎么会小于64*4呢?

4

1 回答 1

52

这样看。操作系统文件系统中用于存储数据的每个块都需要一定数量的元数据与您正在写入的实际文件数据一起存储。例如:时间戳(创建、修改)、文件名、所有权/权限位。对于跨越多个块的文件,您还必须存储每个块的 ID 以及它们链接在一起的顺序等。

确定操作系统中的块大小是一种权衡的情况。每个文件必须至少占据一个块,即使文件长度为 0 字节,所以文件的元数据需要附加到一些东西上。除非您可以保证您的文件的大小始终是块大小的倍数(例如,在 4k 块 OS 中,所有文件都是 4k),否则对于不完全适合的文件会有一定的浪费那个街区。

当您需要存储许多小文件时,小块大小很好。另一方面,更多块 = 更多元数据,因此您最终会在开销上浪费大量存储系统,跟踪所有文件的位置。

另一方面,大块意味着更少的元数据,但在存储小文件时也意味着更大的浪费。例如,存储在 4k 块中的 1 字节文件浪费了该块的 3.99k。

操作系统必须为这些块中的每一个分配一个 ID 号,以便对其进行唯一标识。使用 8 位 ID 字段的操作系统只能跟踪 256 个块,因此,通过扩展,只能跟踪 256 个文件。但如果这些块中的每一个实际上都是 1 兆字节,那么您最多可以存储 256 兆字节的数据。

您链接到的文章有一个错字/逻辑缺陷:它们的意思是 512 BYTES,而不是 512k,所以 64*512 字节小于 64*4k,即 64*4096 字节。大多数硬盘驱动器附带 512 字节的扇区/块大小。

然而,如前所述,小块意味着更多的元数据。现在驱动器大小在 3+ TB 范围内,具有 512 字节块,您必须拥有 3TB/512 字节 = 64.4 亿块的元数据存储。这是空间的一大浪费。因此,现在他们交付的驱动器具有 4k 块,大 8 倍,因此您只需要存储 8.05 亿块的元数据。可能的文件总数减少了 8 倍,但元数据量的减少意味着您实际上可以存储更多的可用数据。

顺便说一句,64 亿块比 32 位系统可以直接寻址的块要大。2^32 的上限约为 42 亿,因此较旧的 32 位机器无法使用整个 3TB 驱动器。因此切换到更大的块大小。32 位盒子可以轻松处理 8.05 亿个区块。

于 2012-09-10T05:45:09.040 回答