据观察,谷歌并未通过其企业搜索解决方案 Google Search Appliance 提供良好的索引。但是 Apache solr 有很好的索引能力。我们可以使用 apache solr 来索引文档,然后通过 GSA 服务器搜索这些文档。这样我们就可以两全其美。请发表你的想法??
问问题
129 次
2 回答
2
您能否提供更多详细信息,说明您认为 GSA“没有提供良好索引”的原因?
在结果相关性方面,GSA 通常被认为是最好的或至少是最好的之一。当涉及到非网络内容时,Google 提供了多个连接器以允许您在 GSA 中索引此内容,如果您的内容源既不是基于网络的也不是由 Google 连接器之一覆盖,那么编写您的自己的。因此,我不确定您为什么认为索引不好,如果您能详细说明,那将非常有帮助。
Mohan 说您不能通过 GSA 提供 Solr 内容是不正确的,您当然可以这样做。您需要做的是创建一个单一框模块,以便您可以实时联合 Solr 结果,它们将显示在主 GSA 结果的右侧。
于 2015-05-21T00:40:57.680 回答
-1
你的数据源是什么?
如果是网站抓取,据我所知,GSA 为网站提供了比 Solr 更复杂的抓取/索引功能。因为 Solr 需要外部工具包,例如 Tika 或 Nutch 来爬取 Web 资源。另一方面,GSA 有自己的爬虫,这使得爬取简单而有效。
关于您通过 Solr 建立索引和通过 GSA 提供服务的问题,可以通过 onebox 模块。(请参阅 BigMikeW 的回答)
如果您可以提供有关您的数据源的一些信息,它可能会帮助人们提出最佳解决方案来提高 GSA 中的索引能力。
于 2015-05-19T17:13:24.153 回答