2

Lucene是一个很棒的开源索引库,我的问题不是如何使用这种索引工具,而是学习和理解它们是如何设计的。

也许我应该阅读Lucene的源代码,但我似乎找不到任何关于如何完成这项伟大工作的教程。

那么,有没有其他方法或书籍可以帮助我具体了解如何设计这样的索引系统?

谢谢你。

4

1 回答 1

3

Lucene 背后的科学被称为信息检索。当您开始了解信息检索背后的算法和数据结构时,您就完成了,Lucene 或 Sphinx 只是解决您任务的工具。第一件事是你可以通过倒排索引数据结构。

一本关于信息检索算法和数据结构的好书可以在这里找到:http: //nlp.stanford.edu/IR-book/这个斯坦福文本是一个很好的资源,也是了解信息检索系统如何的一个很好的起点被设计

于 2012-06-11T13:25:02.773 回答