3

我在 PostgreSQL 中有下表:

CREATE TABLE index_test
(
    id int PRIMARY KEY NOT NULL,
    text varchar(2048) NOT NULL,
    last_modified timestamp NOT NULL,
    value int,
    item_type varchar(2046)
);
CREATE INDEX idx_index_type ON index_test ( item_type );
CREATE INDEX idx_index_value ON index_test ( value )

我做了以下选择:

explain select * from index_test r where r.item_type='B';
explain select r.value from index_test r where r.value=56;

执行计划的解释如下:

index_test r 上的 Seq 扫描(成本=0.00..1.04 行=1 宽度=1576)
    过滤器:((item_type)::text = 'B'::text)'

据我了解,这是全表扫描。问题是:为什么不使用我的索引?

可能是,原因是我的表中的行太少?我只有20个。您能否为我提供一条 SQL 语句,以便用随机数据轻松填充我的表以检查索引问题?

我找到了这篇文章:http: //it.toolbox.com/blogs/db2luw/how-to-easily-populate-a-table-with-random-data-7888,但它对我不起作用。语句的效率并不重要,重要的是简单性。

4

2 回答 2

5

也许,原因是我的表中的行太少了?

是的。对于表中总共 20 行,seq 扫描总是比索引扫描快。很可能这些行无论如何都位于单个数据库块中,因此 seq 扫描只需要单个 I/O 操作。

如果你使用

explain (analyze true, verbose true, buffers true) select ....

您可以看到有关实际情况的更多详细信息。

顺便说一句:您不应该将text其用作列名,因为这也是 Postgres 中的数据类型(因此是保留字)。

于 2013-03-18T11:09:36.217 回答
1

您找到的示例适用于 DB2,您可以在 pg 中使用generate_series它。例如像这样:

INSERT INTO index_test(data,last_modified,value,item_type) 
SELECT
    md5(random()::text),now(),floor(random()*100),md5(random()::text) 
    FROM generate_series(1,1000);
SELECT max(value) from index_test;

http://sqlfiddle.com/#!12/52641/3

上面小提琴中的第二个查询应该使用仅索引扫描。

于 2013-03-18T11:01:38.110 回答