4

虽然估计直线行和表大小是相当简单的数学运算,但我们发现猜测每个索引将占用多少空间(对于给定的表大小)具有挑战性。我们可以学习哪些领域来计算指数的更好估计和增长率?

4

2 回答 2

6

索引叶有一个前导码,用于标识数据页(7 个字节加上一些用于可变长度列的目录信息,如果有的话)加上一个键值的副本,该副本与这些列的表数据大小相同。表中的每一行都有一个。索引的较高级别要小得多,通常不到叶子的 1%,除非您正在索引一个非常宽的键。

填充因子留出一些空间,以便更新和插入不会产生过多的叶子分裂流量。

编辑:这个 MSDN 链接描述了页面级结构,尽管它对单个索引行的格式有点轻。 该演示在某种程度上涉及磁盘日志条目和数据页的物理格式。 这是一个更详细的信息,包括索引数据结构。数字列和固定长度列的大小与盒子上说的一样;您将不得不估计 varchar 列的平均大小。

作为参考,可以在此处此处找到有关 Oracle 块格式的一些文档。

于 2008-10-07T08:24:59.460 回答
1

如果可能的话,我通常会从原始表中取出 1000 条记录,将它们插入到我自己的表中,并使用下面的脚本来制作一个示例。

好的,这不准确,但可以给我一个起点。

--Find out the disk size of an index:
--USE [DB NAME HERE]
go
SELECT
OBJECT_NAME(I.OBJECT_ID) AS TableName,
I.name AS IndexName,   
8 * SUM(AU.used_pages) AS 'Index size (KB)',
CAST(8 * SUM(AU.used_pages) / 1024.0 AS DECIMAL(18,2)) AS 'Index size (MB)'
FROM
sys.indexes I
JOIN sys.partitions P ON P.OBJECT_ID = I.OBJECT_ID AND P.index_id = I.index_id
JOIN sys.allocation_units AU ON AU.container_id = P.partition_id
--WHERE 
--    OBJECT_NAME(I.OBJECT_ID) = '<TableName>'    
GROUP BY
I.OBJECT_ID,    
I.name
ORDER BY
TableName

--========================================================================================

--http://msdn.microsoft.com/en-us/library/fooec9de780-68fd-4551-b70b-2d3ab3709b3e.aspx

--I believe that keeping the GROUP BY 
--is the best option in this case
--because of sys.allocation_units
--can have 4 types of data inside
--as below:

--type tinyint
--Type of allocation unit.
--0 = Dropped
--1 = In-row data (all data types, except LOB data types)
--2 = Large object (LOB) data (text, ntext, image, xml, large value types, and CLR     user-defined types)
--3 = Row-overflow data

--marcelo miorelli 8-NOV-2013
--========================================================================================
于 2014-05-23T13:08:36.660 回答