我有一个使用 Spring Framework 用 Java 编写的网站。我有 10 个将同时运行的批处理作业,它们的工作是抓取选定的网站,处理它们并在 SOLR 中对它们进行索引。SOLR、客户端应用程序和数据库将托管在亚马逊 AWS 主机上。
我想知道在网络主机(亚马逊 AWS)上托管大量依赖带宽(下载网页)的批处理作业是否是个好主意?或者我应该在我的本地计算机上运行它们,因为如果它们失败了,监控它们会更容易。
如果我在本地运行作业,我将不得不定期从主机上的客户端数据库中复制一个表 (URLS_SUBMITTED),以便批处理作业处理 URL。我还需要与 SOLR 建立安全的 HTTPS 连接来更新文档。
如果我将它托管在网络主机上,那么我只需要一个数据库,但工作将更难维护。
根据经验,您推荐哪种方法?