我想知道搜索索引和数据库索引之间的区别是什么。我知道数据库索引使用指向实际数据的排序指针,而搜索索引(例如,使用倒排索引)使用类似哈希表的结构将单词与包含该单词的文档进行映射。索引在这两种情况下意味着不同的东西。我的问题是——这两种情况真的不同吗?数据库索引和搜索索引是不同的概念吗?我想我只是对这里的“索引”一词感到困惑。对此的任何澄清表示赞赏。
问问题
2682 次
1 回答
2
数据库索引由来自目标应用程序的查询驱动。通常,您在设计数据库并决定要索引哪些属性时有明确的要求。例如,如果属性 A 在数据库中被索引,那么它的目的是加速属性 A 上的一些已知的、潜在的查询 Q(或查询集)。
另一方面,网络搜索(或关键字搜索)更多的是自由形式。当搜索引擎索引一个文档(网页)时,它没有关于查询的先验知识。因此,它需要尝试理解文档(通过自然语言处理)并索引可能感兴趣的任何关键字和短语。
虽然搜索索引和数据库索引共享许多通用技术,但要求是不同的。I/O 效率和一致性是数据库索引的首要关注点。而搜索索引有利于可扩展性和空间效率(时间效率是通过分布和并行性实现的)。此外,搜索索引不需要召回所有匹配的文档;在大多数情况下,检索几百个排名靠前的条目就足够了。
于 2013-03-31T08:41:20.103 回答