我们有客户提供的索引文件,现在想通过删除重复的文档来重新索引它们
为此,我必须从索引中读取数据,并且必须生成XML文件或CSV文件,然后对它们进行索引并消除重复项
(如果我错了,请纠正我,我没有找到任何其他方法来做到这一点)
我知道使用 Lucene 可以做到这一点,但我想知道如何使用 solr 来做到这一点
您可以通过在 Solr 查询中将wt
参数设置为 xml
来更改导出格式。...&wt=xml
这会将结果导出到 xml。因此,如果您搜索 *,您将获得完整的内容 - 取决于limit
参数。