1

我需要实现以下逻辑:

  1. 具有多个(高级未知)页面的 PDF 被上传并保存到 S3
  2. 页面图像通过 lambda 函数从 pdf 中提取并保存到 S3。
  3. 每个图像都由 lambda 函数(同时)分析。结果保存到 S3 或发电机。
  4. 分析完所有图像后,运行最终的单个 lambda 组合所有结果。

我的主要问题之一是如何在步骤 3 的所有并发 lambda 完成时触发。实现这一目标的最佳、最优雅的方式是什么?我有建议尝试使用 AWS step 功能,但似乎 Parallel 状态只能有固定数量,提前知道分支。

4

1 回答 1

2

由于您已经在解决方案中使用了 Dynamodb,因此我可以想到一种可能的解决方案:

Step 2: 
        Extract Images and store total_count in Dynamodb
Step 3: 
       At the end of Lambda increment new column current_count
       if(current_count==total_count){ trigger Step 4 }
于 2017-07-10T08:27:27.450 回答