4

我一直在尝试在 solr 中做相当于 UPSERT(如果已经存在则插入或更新)的操作。我只知道什么不起作用,并且我阅读的 solr/lucene 文档没有帮助。这是我尝试过的:

curl 'localhost:8983/solr/update?commit=true' -H 'Content-type:application/json' -d '[{"id":"1","name":{"set":"steve"}}]'
{"responseHeader":{"status":409,"QTime":2},"error":{"msg":"Document not found for update.  id=1","code":409}}

我在一个请求中最多进行 50 次更新,并且请求可能包含具有专有字段(例如 title_en 和 title_es)的相同 ID。如果有一种方法可以查询是否存在 id 列表,我可以拆分数据并执行单独的插入和更新命令……这将是一个可接受的替代方案,但是否已经有一个处理程序可以做到这一点?在这一点上,我想避免做任何内部例程。

谢谢。

4

2 回答 2

4

使用 Solr 4.0,您可以对所有这些文档进行部分更新,仅使用已更改的字段将保持完整文档相同。id 应该匹配。

于 2013-02-15T04:07:38.840 回答
0

Solr 不支持开箱即用的 UPSERT 机制。您可以创建记录,也可以更新记录,但语法不同。

如果您更新记录,您必须确保所有其他预先插入的字段都已存储(不仅仅是索引)。在幕后,更新会创建一个全新的记录,该记录只是预先填充了以前存储的值。但是如果功能非常深入(可能在 Lucene 本身中)。

你看过DataImportHandler吗?您反转控制流(从 Solr 开始),但它确实支持检查哪些记录需要更新以及哪些记录需要创建。

或者您可以只运行一个 solr 查询,例如http://solr.example.com:8983/solr/select?q=id%3A(ID1+ID2+ID3)&fl=id&wt=csv您要求 Solr 查找您的ID 记录并仅返回它找到的记录的 ID。然后,您可以对其进行后期处理以分割您的更新和插入。

于 2013-02-15T13:12:03.400 回答