1

我想通过索引处理程序将 CSV 导入 solr,如文档中所述: https ://solr.apache.org/guide/7_1/uploading-data-with-index-handlers.html#csv-update-parameters

我有一个具有以下结构的 CSV:

ID    |    Name    |    Property    |
1     |    Tee     |     Sweet      |
1     |    Tee     |     Fluid      |
1     |    Tee     |      Hot       |
2     |   Bread    |     Salty      |
3     |    Milk    |     Fluid      |

如果 ID 相同,则第一个值始终相等,只有属性不同。现在我想将该属性作为多值字段导入到 solr。

有没有办法用索引处理程序来实现这一点。如果没有,还有什么办法?

4

1 回答 1

1

我将编写一个程序来扫描 CSV 数据并生成可以摄取到 Solr 中的 JSON 对象。这将要求您扫描 CSV 文件中的所有行,以便您可以聚合具有相同 ID 的行的属性,这样您最终会得到如下所示的 JSON:

[
{id: 1, name: "Tree", properties: ["Sweet", "Fluid", "Hot"]},
{id: 2, name: "Bread", properties: ["Salty"]},
{id: 3, name: "Milk", properties: ["Fluid"]}
]

您将希望使用与您的架构或动态字段定义匹配的字段名称,以便它们也被正确索引。

于 2021-09-16T13:58:26.240 回答