将大数据从 Oracle DB 索引到弹性搜索集群的选项有哪些?要求是将 3 亿条记录一次索引到多个索引中,并且每天进行大约 100 万次更改的增量更新。
我已经尝试过 elasticsearch river/feeder的 JDBC 插件,两者似乎都在内部运行或需要本地运行的弹性搜索实例。请让我知道是否有任何更好的选择可以将弹性搜索索引器作为独立作业(可能基于 Java)运行。任何建议都会非常有帮助。谢谢。
将大数据从 Oracle DB 索引到弹性搜索集群的选项有哪些?要求是将 3 亿条记录一次索引到多个索引中,并且每天进行大约 100 万次更改的增量更新。
我已经尝试过 elasticsearch river/feeder的 JDBC 插件,两者似乎都在内部运行或需要本地运行的弹性搜索实例。请让我知道是否有任何更好的选择可以将弹性搜索索引器作为独立作业(可能基于 Java)运行。任何建议都会非常有帮助。谢谢。
我们使用 ES 作为报告数据库,当新记录写入 SQL 时,我们采取以下操作将它们放入 ES:
这个过程非常有效,因为它同时处理新数据和旧数据。对于旧数据,只需编写一个快速脚本将 300M 主键写入 rabbit 即可!
有许多集成选项 - 我列出了一些给您一些想法,但解决方案实际上将取决于您的特定资源和要求。