0

我正在上传许多 csv 文件

货币.csv 文件:

code,currency_name,currency_decimals
AUD,Australian Dollar,2
GBP,Pound Sterling,2
...
...

currency_holidays.csv 文件:

code,holiday_date,holiday_name
AUD,02/01/2012,New Year's Day Observed
AUD,26/01/2012,Australia Day
...
...

注意:在 solr 配置文件中将 uniqueKey 设置为“code”

  1. 如果我将这些文件上传到 solr 单核,它将覆盖匹配的货币记录,例如 AUD。正确的?

  2. 每个文件都有核心更好吗?即多核。

这是我之前的帖子:

apache solr csv文件相同的值

什么是最好的解决方案?我需要帮助。希望有人能帮忙。

谢谢总经理

4

1 回答 1

0

您可能需要考虑的一些要点:-

  1. 如果您有完全不同的实体,它们没有任何共同之处并且也没有依赖关系(没有连接),那么最好将它们作为单独的核心。
  2. 这将是一种更清洁的方法。
  3. 因为可能有一些字段有一个共同的名称,需要以不同的方式进行分析,以及
  4. 搜索以不同方式表现字段及其提升
  5. 如果数据很大,这也是可以管理的。

但是,如果您有一个非常小的数据集,并且没有上述任何内容,那么您只需使用一个核心即可。
您可以使用唯一键为 id 添加前缀,例如 curreny_aud 和 holiday_aud,这将帮助您保持实体分离并防止覆盖。

于 2013-05-24T03:51:34.637 回答