0

我从实际上在 SQL Server 中的数据开始一个 Elastic search 5 项目,所以我从头开始:

我正在考虑如何从我的 SQL Server 导入数据,尤其是在更新或添加数据时如何同步我的数据。

我在这里看到建议不要进行太频繁的批处理。

但是如何制作同步批处理,​​是我自己写还是有非常常用的工具和做法? RiverJDBC 插件馈送器似乎已被真正使用,但不适用于 Elastic Search 5。*

任何帮助都会非常受欢迎。

4

1 回答 1

2

我建议使用Logstash

  • 它易于使用和设置
  • 您可以在 logstash 配置文件中进行自己的 ETL
  • 一个文件中可以有多个 JDBC 源
  • 您将了解如何进行增量(批量)更新以同步您的数据。这实际上取决于您的数据模型。

这是一篇不错的博客文章:

https://www.elastic.co/blog/logstash-jdbc-input-plugin

于 2017-01-03T13:07:10.767 回答