38

从我能找到的信息来看,它们都解决了相同的问题——更深奥的操作,如数组包含和交集(&&、@>、<@ 等)。但是,我会对有关何时使用其中一种(或两者都不可能)的建议感兴趣。PostgreSQL 文档有一些关于此
的信息:

  • GIN 索引查找比 GiST 快大约三倍
  • GIN 索引的构建时间大约是 GiST 的三倍
  • GIN 索引的更新速度比 GiST 慢十倍左右
  • GIN 索引比 GiST 大两到三倍

但是,我特别想知道当内存与索引大小的比率开始变小时(即索引大小变得比可用内存大得多)时是否会对性能产生影响?我在#postgresql IRC 频道上被告知 GIN 需要将所有索引保存在内存中,否则它不会有效,因为与 B-Tree 不同,它不知道从磁盘读取哪个部分一个特定的查询?问题是:这是真的吗(因为我也被告知相反的情况)?GiST 有同样的限制吗?在使用其中一种索引算法时,我还应该注意其他限制吗?

4

1 回答 1

17

首先,您是否需要将它们用于文本搜索索引?GIN 和 GiST 是专门针对某些数据类型的索引。如果您需要索引简单的字符或整数值,那么普通的 B-Tree 索引是最好的。
无论如何,PostgreSQL 文档有一章是关于GIST的,一章是关于GIN的,你可以在其中找到更多信息。
而且,最后但并非最不重要的一点是,找到最好的最好方法是生成样本数据(尽可能多地成为真实场景),然后创建 GIST 索引,测量创建索引需要多少时间,插入一个新值,执行一个示例查询。然后删除索引并对 GIN 索引执行相同操作。比较这些值,您将根据您的数据获得所需的答案。

于 2008-08-25T17:00:24.947 回答