考虑具有以下字段的 Solr 索引:
<fields>
<field name="id" type="uuid" indexed="true" stored="true" default="0"/>
<field name="user" stored="true" type="string" multiValued="false" indexed="true"/>
<field name="text" stored="true" type="textmulti" multiValued="false" indexed="true"/>
<field name="media" stored="true" type="string" multiValued="false" indexed="true"/>
</fields>
如果存在具有相同user
和text
字段的当前文档,无论id
或media
字段的内容是什么,我都会认为新索引的文档是一个骗子(因此被拒绝)。具有匹配user
或 text
不足以被视为欺骗的文档,它必须同时是 user
和 text
。
我已经阅读了 Solr wiki 上用于更新 Solr 索引的文档重复检测和XML 消息,但我仍然看不到如何配置它。有任何想法吗?我正在使用出色的solr-php-client通过 PHP 连接到 Solr。
谢谢。