我有以下流程:
我的作业 Lambda 调用 API 网关来获取我的作业日志。API 网关由一个主 Lambda 支持,它根据给定的参数调用另外两个 Lambda(读取或写入)。这些读取和写入是在 DynamoDB 表上完成的。该解决方案在过去 2 个月内运行良好,但由于过去一周我观察到异常行为,5XX 和 4xx 错误大幅增加,我也将它们作为主要 'Endpoint request timed out'
. 我无法理解是什么突然改变导致这种情况。这种异常行为的根本原因是什么,因为有时它被正确执行,有时却没有。所有 Lambda 都部署在私有子网中。他们所有人的安全组在入站中均不包含任何内容,而出站则包含所有目的地。私有子网包含 NAT 网关。我理解理想情况下我应该为 DynamoDB 和 API Gateway 使用 VPC 端点,但我最初错过了这一点。