可能重复:
lucene 如何索引文档?
Lucene 允许对文档的某些(或全部)字段进行索引,仅返回一个 ID,然后可以使用该 ID 查询数据库以获取实际信息。然而,为了能够在那时进行搜索,Lucene 必须以某种方式存储这些字段。
这究竟是如何完成的?仅索引字段是否组合成散列或树状结构,然后用于搜索?是否有任何关于 Lucene 如何搜索这些仅索引字段的文档?
我主要关心的是了解索引数据存储在高度敏感的环境中的安全性。或者换句话说,检索索引字段并将它们与文档相关联以及因此与该文档中的其他字段相关联的难度/容易程度。