0

我尝试使用远程服务器上的 lucene 索引作为安装在同一服务器上的胡萝卜 2 的输入。关于文档,carrot2-dcs 应该可以实现(文档第 3.4 章 Carrot2 文档集群服务器:包括各种文档来源。Carrot2 文档集群服务器可以从大量来源获取和集群文档,包括主要的搜索引擎和索引引擎(Lucene , 索尔))。

安装carrot2-dcs 3.9.3 后,我发现lucene 不能作为文档源。如何进行?

4

1 回答 1

0

要对来自 Lucene 索引的内容进行聚类,该索引需要在 DCS 正在运行的服务器上可用(通过本地文件系统或例如作为 NSF 挂载)。

要使 Lucene 源在 DCS 中可见:

  1. 打开编辑:war/carrot2-dcs.war/WEB-INF/suites/source-lucene-attributes.xml
  2. 取消注释配置部分并提供 Lucene 索引的位置以及应为文档标题和内容提供服务的字段(至少需要一个)。请记住,这些字段必须“存储”在 Lucene speak中。
  3. 确保将编辑后的文件打包回 WAR 存档并运行 DCS。您现在应该看到 Lucene 文档源。
于 2014-08-18T17:33:34.363 回答