1

我正在使用 DIH 和 TikaProcessor 从数据库和 SolrJ API 中提取二进制数据进行查询。

我们有如下数据结构,其中一个订单可以有多个附件。附件可以包含 100-300 mb 范围内的巨大二进制数据。

订单表

订单号 | 细节

附件表

姓名 | 数据 | 订单号

使用这种结构,创建 solr 文档的最佳方式是什么?

选项 1:每个订单一个 solr 文档,附件有多值字段

选项 2:每个附件一个文档 - 扁平结构。如果我们需要订单的所有文档,请使用 solr 分组/折叠。

我们还需要突出能力。

每个选项的性能影响是什么?我更倾向于选项 2。有什么想法吗?

4

0 回答 0