1

我们有客户提供的索引文件,现在想通过删除重复的文档来重新索引它们

Solr 重复数据删除

为此,我必须从索引中读取数据,并且必须生成XML文件或CSV文件,然后对它们进行索引并消除重复项

(如果我错了,请纠正我,我没有找到任何其他方法来做到这一点)

我知道使用 Lucene 可以做到这一点,但我想知道如何使用 solr 来做到这一点

4

1 回答 1

1

您可以通过在 Solr 查询中将wt参数设置为 xml 来更改导出格式。...&wt=xml

这会将结果导出到 xml。因此,如果您搜索 *,您将获得完整的内容 - 取决于limit参数。

http://wiki.apache.org/solr/CoreQueryParameters#wt

这也适用于 csv:http ://wiki.apache.org/solr/CSVResponseWriter

于 2013-01-04T13:18:38.670 回答