我正在寻找有关 AWS 架构决策的方向。我的目标是允许用户将文件 ftp 到 EC2 实例,然后对文件进行一些分析。我的重点是尽可能多地以面向服务的方式构建它......并在未来将其扩展到多个客户端,每个客户端都有自己的 ftp 服务器和处理队列,而不会混合数据。
目前,我有一个安装了 vsftpd 的 dev EC2 实例和一个运行 Chokidar 的 node.js 进程,它不断地监视要删除的新文件。当该文件丢失时,我希望通知另一台服务器或一组服务器来获取该文件并对其进行处理。
ftp 服务器是否应该将文件移动到 S3,然后使用 SQS 让处理服务器池知道它已准备好进行处理?我应该使用 SQS,然后让服务器池 ssh 进入 ftp 实例(或其他方法)来获取文件,而不是使用 S3 作为中介吗?有更好的方法吗?
非常感谢任何指导。随意向我学习任何可以在高文件量下省钱的替代想法。