背景
我有一个 API Gateway 端点,它代理 Lambda 函数 (Lambda A),供我的 React 应用程序获取客户数据。
这个 lambda 函数调用 API 来获取客户数据,但是响应的格式还有很多不足之处。所以我想重新格式化它。
我没有将这种重新格式化的逻辑填充到 Lambda A 中,而是编写了一个单独的 Lambda 函数 (Lambda B)。当我的 API Gateway 端点被命中时,我需要调用这两个函数,并且第一个的输出是第二个的输入。
第一个想法:阶梯函数
阶跃函数看起来很自然,但可以在阶段之间传递的数据有效负载的大小有 32kb 的限制。我们的客户数据 json blob 经常超过这个值。
对于这种情况,我听说的唯一“最佳实践”是将有效负载写入 S3,然后将对象密钥传递到下一阶段。
这很好,但我对不得不向 S3 写入和删除这么多短暂的对象并不感到兴奋。每天可能有数十或数十万个这样的请求。所以我放弃了阶梯函数方法(现在)。
当前方法
我目前正在使用 javascript SDK 直接从 Lambda A 调用 Lambda B。这有相当多的缺点。值得注意的是,我有时会同时运行两个 lambda,而没有性能优势。换句话说,我付钱让 Lambda A 坐在那里等待来自 Lambda B 的响应(我也为此付费)。
这感觉像是一种反模式,我听说它是这样描述的。
问题
这似乎是一个相对常见的场景 - 进行 API 调用(函数 A),然后执行一些额外的逻辑来补充、重新格式化或以其他方式修改该响应(函数 B),然后将其传递回调用者。
当然,我不是第一个想要使用两个 Lambda 函数来做这样的事情的人。
假设我不能使用阶跃函数,我有什么选择可以使用两个 lambda 函数?
除了使用 S3 之外,还有其他方法可以解决 Step Functions 的 32kb 有效负载大小限制吗?
如果我因为想要避免 S3/Step Function 方法而感到愚蠢,那么解释为什么我的担忧没有根据的答案也将受到欢迎。
编辑
为什么您甚至考虑将获取数据和处理数据的功能拆分为两个不同的 AWS Lambda 函数?
想象一下,我有两打 Lambda 需要使用 Lambda B 的功能,而不仅仅是 Lambda A。
因此,我将 Lambda B(的功能)打包,发布到 Nexus,而我的另外两打 Lambda 都在构建时使用它。我所有的 lambdas 的大小都在膨胀,当我积累更多的“Lambda B”时,我必须发布更多的 npm 包。这是我想要避免的。
我希望我的“Lambda A”使用其他 lambda,而不是 npm 包,以实现广泛共享的功能。也许我在字面上理解“lambda 函数”中的“函数”,或者我只是想充分利用 FaaS 的潜力。