请任何人指出我如何设计/构建将消耗 TB 数据并对检索到的数据执行一些计算的 Web 服务客户端的正确方向?
我在新工作中继承了一个项目。在我加入团队前几周,该项目已经设计并由团队启动。该项目是关于从几个 Web 服务(soap 和 rest)中检索数据,并在存储到数据库、向用户显示和生成报告之前对数据执行一些计算。
获取数据的过程包括从 Web 服务 A、B、C 中提取一些数据,并使用响应向 Web 服务 X、Y&Z 发出另一个请求。(我们无法控制 Web 服务生产者)。当前的实现非常慢,大多数时候我们在尝试对检索到的数据进行一些计算时会耗尽内存。数据以 TB 或更多为单位。当前的实现使用 maven/spring。
我正在为这个项目制定一个新的设计(引入一些缓存等),但我需要以前遇到过此类问题的任何人的一些建议。
除了显而易见的,还有什么特殊的技巧或方法可以解决这个问题吗?我知道这对某些人来说可能听起来像一个愚蠢的问题,但任何指针都会有所帮助。