我们一直在以下用例中使用 Spring Batch
- 从文件中读取数据,处理并写入目标数据库(文件到达时开始批处理)
- 从远程数据库读取数据,处理并写入目标数据库(按预定时间间隔运行,由 Autosys 触发)
由于计划将所有在线应用程序迁移到 spring-boot 微服务和 PCF,我们正在考虑在批处理方面进行类似的练习,如果它可以增加价值。
在新世界中,spring cloud 批处理作业任务将从 S3 存储(ECSS3)读取文件。
我在这里寻找好的设计(尽可能远离过多的管道/过滤器和编排),输入数据范围从 1MM 到 20MM 记录
- ECSS3 将通过发送 http 请求来通知文件到达,工作流将是 - could stram httpsource->launch could 批处理作业任务,该任务将从对象存储中读取,处理并将记录保存到目标数据库
- 从 PCF 调度程序触发的 Spring Cloud Job Task 从远程数据库读取,处理并保存到目标数据库
通过上面的设计,我看不到将spring批处理作业包装成云任务并在带有spring数据流的PCF中运行的价值
我在这里错过了什么吗?在这种情况下,PCF/SpringClouldDataFlow 是不是有点矫枉过正?