2

我在使 postgres 使用我的多列索引使用 btree_gin 扩展进行完整搜索时遇到问题。这是用于文章的搜索页面。使用 btree_gin 背后的想法是能够获取 'id' 字段进行排序,并获得 magazine_id 作为过滤器:

CREATE INDEX idx_gin_search ON article USING gin(id, magazine_id, search_vector_full) WITH (fastupdate = off);

Postgres 决定在杂志上使用 btree 索引,然后过滤(=慢):

Executed SQL
SELECT ••• FROM article WHERE (( (article.search_vector) @@    
(plainto_tsquery('pg_catalog.english', 'interesting'))) AND    
article.magazine_id = 7) ORDER BY article.id ASC LIMIT 36
Time 13.4780406952 ms

QUERY PLAN
Limit  (cost=2021.87..2021.96 rows=36 width=384) (actual time=9.782..9.787 rows=36 loops=1)
  ->  Sort  (cost=2021.87..2027.49 rows=2248 width=384) (actual time=9.781..9.784 rows=36 loops=1)
    Sort Key: id
    Sort Method: top-N heapsort  Memory: 53kB
    ->  Index Scan using idx_magazine_id on article (cost=0.29..1952.53 rows=2248 width=384) (actual time=0.035..8.924 rows=2249 loops=1)
          Index Cond: (magazine_id = 7)
          Filter: (search_vector @@ '''interesting'''::tsquery)
          Rows Removed by Filter: 11413
Planning time: 4.600 ms
Execution time: 9.860 ms

然后,我发现更不了解的是,它也拒绝在 LIST 页面上使用这个简单的 btree 索引来查找文章,它们只是按每页的降序排列 x:

CREATE INDEX idx_btree_listing ON article USING btree(id DESC, magazine_id);

同样,它不使用多列索引:

Executed SQL
SELECT ••• FROM article WHERE article.magazine_id = 7
ORDER BY article.id DESC LIMIT 36
Time 1.4750957489 ms

QUERY PLAN
Limit  (cost=0.29..7.48 rows=36 width=384) (actual time=0.034..0.115 rows=36 loops=1)
->  Index Scan Backward using idx_magazine_id on article  (cost=0.29..2729.56 rows=13662 width=384) (actual time=0.031..0.107 rows=36 loops=1)
    Filter: (magazine_id = 7)
    Planning time: 1.354 ms
    Execution time: 0.207 ms

编辑:以上是记录较少且只有 1 个杂志的开发设置,因此速度很快。这是生产服务器上由 auto_explain 生成的日志:

duration: 230.629 ms  plan:
SELECT article.id, article.title, article.date, article.content FROM article WHERE article.magazine_id = 7 ORDER BY article.id DESC LIMIT 36

Limit  (cost=0.42..43.67 rows=36 width=306) (actual time=229.876..229.995 rows=36 loops=1)
    ->  Index Scan Backward using idx_magazine_id on article (cost=0.42..239539.22 rows=199379 width=306) (actual time=229.866..229.968 rows=36 loops=1)
    Filter: (article.magazine_id = 7)
    Rows Removed by Filter: 116414

我将不胜感激任何人能给我进一步调试的提示。

4

1 回答 1

1

多列索引中的第一列是 id。你不过滤 id 所以 postgres 不会使用那个索引。您不必过滤索引中的所有列,但您过滤的列必须是索引中的前 n 列。

尝试尝试使用您拥有的索引的变体,例如将 id 移到末尾或从索引中省略 id。

于 2016-02-02T11:36:53.660 回答