从 stackoveflow.com 的角度来看(由 2-3 名工程师组成的团队构建一个旨在扩展的网站项目),在开发过程的早期花费精力来构建基于 Lucene/Autonomy 的搜索是否有意义……而不是基于数据库全文搜索。
优点/缺点:
对于像 nutch 或自治这样的成熟 Lucene 实现,在后期迁移到 Lucene(这是不可避免的)的成本可以忽略不计。
大量添加额外的索引服务器(比如使用 nutch)来维护不断增长的搜索索引相对容易。
对于 Lucene 实现,我很可能需要一个额外的服务器来维护内存索引(在扩展过程的早期阶段)。