3

我们有一个要求,我们必须使用 ElasticSearch 来执行全文搜索。我们有一个基于 Spring 的应用程序,为了与 ES 集成,我们可以使用 Elastic Search 的 Java API 或 ElasticSearch 的 Spring Data。

输入将是大小约为 5MB 的文件类型。

我浏览了 ES Java API 和 SpringData 的示例,它们确实有可用于插入 JSON 文档的教程。

但是没有关于使用 File 作为输入来创建文档/索引的任何帮助。

我是 Elastic Search 的新手,对此的任何指导/帮助将不胜感激。

编辑:

我可以看到 ES 中有一个摄取附件处理器插件(https://www.elastic.co/guide/en/elasticsearch/plugins/master/ingest-attachment.html)。

任何人都可以指向一个示例 CURL 请求以使用此插件或任何 Java 代码来使用此插件

4

1 回答 1

3

1.您可以使用Elasticsearch 映射器附件插件。该插件使用 Apache Tika 来摄取几乎所有知名类型的文档,并使其可被 Elasticsearch 搜索。

https://www.elastic.co/guide/en/elasticsearch/plugins/2.3/mapper-attachments.html

2.您可以使用Apache Tika 从文件中提取有用的内容并使用elasticsearch Bulk Indexing api索引到ES

希望有帮助

于 2016-04-21T12:03:47.243 回答