0

考虑具有以下字段的 Solr 索引:

<fields>
    <field name="id" type="uuid" indexed="true" stored="true" default="0"/>
    <field name="user" stored="true" type="string" multiValued="false" indexed="true"/>
    <field name="text" stored="true" type="textmulti" multiValued="false" indexed="true"/>
    <field name="media" stored="true" type="string" multiValued="false" indexed="true"/>
</fields>

如果存在具有相同usertext字段的当前文档,无论idmedia字段的内容是什么,我都会认为新索引的文档是一个骗子(因此被拒绝)。具有匹配user text不足以被视为欺骗的文档,它必须同时是 user text

我已经阅读了 Solr wiki 上用于更新 Solr 索引的文档重复检测和XML 消息,但我仍然看不到如何配置它。有任何想法吗?我正在使用出色的solr-php-client通过 PHP 连接到 Solr。

谢谢。

4

1 回答 1

1

可能你有一些理由不这样做,但你可以使用用户和文本的连接作为 id,然后你不需要使用重复检测,因为如果你不覆盖 Solr 会为你做这件事

于 2012-09-03T18:35:31.657 回答