2

我有以下结构:

create table bitmex
(
  timestamp timestamp with time zone not null,
  symbol    varchar(255)             not null,
  side      varchar(255)             not null,
  tid       varchar(255)             not null,
  size      numeric                  not null,
  price     numeric                  not null,
  constraint bitmex_tid_symbol_pk
  primary key (tid, symbol)
);

create index bitmex_timestamp_symbol_index  on bitmex (timestamp, symbol);
create index bitmex_symbol_index  on bitmex (symbol);

我每次都需要知道数量的确切值。所以 reltuples 是不可用的。

该表有超过 45,000,000 行。

跑步

explain analyze select count(*) from bitmex where symbol = 'XBTUSD';

Finalize Aggregate  (cost=1038428.56..1038428.57 rows=1 width=8)
  ->  Gather  (cost=1038428.35..1038428.56 rows=2 width=8)
        Workers Planned: 2
        ->  Partial Aggregate  (cost=1037428.35..1037428.36 rows=1 width=8)
              ->  Parallel Seq Scan on bitmex  (cost=0.00..996439.12 rows=16395690 width=0)
                    Filter: ((symbol)::text = 'XBTUSD'::text)

跑步

explain analyze select count(*) from bitmex;

Finalize Aggregate  (cost=997439.34..997439.35 rows=1 width=8) (actual time=6105.463..6105.463 rows=1 loops=1)
  ->  Gather  (cost=997439.12..997439.33 rows=2 width=8) (actual time=6105.444..6105.457 rows=3 loops=1)
        Workers Planned: 2
        Workers Launched: 2
        ->  Partial Aggregate  (cost=996439.12..996439.14 rows=1 width=8) (actual time=6085.960..6085.960 rows=1 loops=3)
              ->  Parallel Seq Scan on bitmex  (cost=0.00..954473.50 rows=16786250 width=0) (actual time=0.364..4342.460 rows=13819096 loops=3)
Planning time: 0.080 ms
Execution time: 6108.277 ms

为什么它不使用索引?谢谢

4

1 回答 1

1

如果必须访问所有行,则只有在不必针对索引中找到的大多数值查询表的情况下,索引扫描才会更便宜。

由于 PostgreSQL 的组织方式,必须访问该表以确定在索引中找到的条目是否可见。如果在表格的可见性图中将整个页面标记为“可见”,则可以跳过此步骤。

要更新可见性地图,VACUUM请在桌子上运行。也许然后将使用仅索引扫描。

但是计算表中的行数并不便宜,即使使用索引扫描也是如此。如果您需要经常这样做,最好有一个单独的表,其中只包含一个行数计数器。然后,您可以编写在插入或删除行时更新计数器的触发器。

这会降低 和 期间的性能INSERTDELETE但您可以以闪电般的速度计算行数。

于 2018-05-23T07:33:15.077 回答