我正在尝试在网站中进行良好的自然语言搜索,并尝试了解 Apache Solr 与 Xapian 的优势。Xapian 似乎更容易设置。两者都提供良好的自然语言搜索吗?任何见解表示赞赏。
user4231
问问题
3356 次
1 回答
7
Xapian 更像 Lucene,一个与应用程序集成的库。如果你有一个 C++ 应用程序,那么 Xapian 可能是一个更好的匹配。如果您有 Java 应用程序,Lucene 几乎肯定是最佳选择。
如果您想要一个搜索服务器,请将 Omega(基于 Xapian)与 Solr(基于 Lucene)进行比较。我没有使用过 Omega 或 Xapian,但 Solr 有一些我开始依赖的功能,尤其是每个字段的分析链。这是一个绝妙的主意,我希望我在从事 Ultraseek 工作时就想到了这个主意。
使用您自己的 Java 类扩展 Solr 分析链非常容易。我希望在 C++ 中使用 Omega/Xapian 会更加困难。
这两个引擎使用不同的底层相关模型。Xapian 是一个概率引擎,Lucene 是一个向量空间引擎。我已经看到这两个模型都调整为表现良好,所以这可能不是决定的理由。
Solr/Lucene 社区很大而且很有帮助。
于 2012-04-11T21:35:37.937 回答