0

我正在努力了解一个人如何(是否可能)能够在一个 Solr 核心中索引多种不同类型的记录的总体观点。多个记录意味着它们具有不同的唯一键

我们倾向于使用单个核心,因为我们希望能够在某些级别上一次搜索所有内容,而不必将核心拼凑在一起。

因此,例如,我的产品具有以下字段:

product_code <--- unique key
product_title 
product_description 
etc...

然后是具有以下字段的工作列表

job_id <---- unique key
job_description
job_title
etc... 

还有多个其他实体,包括Nutch搜索索引,其唯一 ID 为“id”

是否可以在 schema.xml 中包含多个唯一键?这样 id 就不必将每种不同类型的记录发送到不同的 solr 核心?

我主要担心的是,在识别<uniqueKey>s 时,至少需要其中一个,但并非所有发送到 solr 索引的记录都具有所需的键。

在 Solr 中是否有一种公认的方法来解决这个问题?

4

1 回答 1

1

请参阅https://wiki.apache.org/solr/MultipleIndexes#Flattening_Data_Into_a_Single_Indexhttps://wiki.apache.org/solr/UniqueKey

Solr 不需要 uniqueKey。如果您未指定唯一键,则需要执行以下操作 - 当您发布与现有文档具有相同键的新文档时,新文档不会替换旧文档,因此您必须删除首先手动添加旧的,然后添加新的(当然是提交)。

如果您需要一个唯一键,则将前缀附加到基于类型的 ID。然后你可以有另外两个字段,比如 id 和 type。因此,例如:

uniquekey: P1
product_code: 1
type: product

uniquekey: J1
job_id: 1
type: job
于 2013-06-27T20:56:21.493 回答