4

背景

我有一个 API Gateway 端点,它代理 Lambda 函数 (Lambda A),供我的 React 应用程序获取客户数据。

这个 lambda 函数调用 API 来获取客户数据,但是响应的格式还有很多不足之处。所以我想重新格式化它。

我没有将这种重新格式化的逻辑填充到 Lambda A 中,而是编写了一个单独的 Lambda 函数 (Lambda B)。当我的 API Gateway 端点被命中时,我需要调用这两个函数,并且第一个的输出是第二个的输入。

第一个想法:阶梯函数

阶跃函数看起来很自然,但可以在阶段之间传递的数据有效负载的大小有 32kb 的限制。我们的客户数据 json blob 经常超过这个值。

对于这种情况,我听说的唯一“最佳实践”是将有效负载写入 S3,然后将对象密钥传递到下一阶段。

这很好,但我对不得不向 S3 写入和删除这么多短暂的对象并不感到兴奋。每天可能有数十或数十万个这样的请求。所以我放弃了阶梯函数方法(现在)。

当前方法

我目前正在使用 javascript SDK 直接从 Lambda A 调用 Lambda B。这有相当多的缺点。值得注意的是,我有时会同时运行两个 lambda,而没有性能优势。换句话说,我付钱让 Lambda A 坐在那里等待来自 Lambda B 的响应(我也为此付费)。

这感觉像是一种反模式,我听说它是​​这样描述的。

问题

这似乎是一个相对常见的场景 - 进行 API 调用(函数 A),然后执行一些额外的逻辑来补充、重新格式化或以其他方式修改该响应(函数 B),然后将其传递回调用者。

当然,我不是第一个想要使用两个 Lambda 函数来做这样的事情的人。

  • 假设我不能使用阶跃函数,我有什么选择可以使用两个 lambda 函数?

  • 除了使用 S3 之外,还有其他方法可以解决 Step Functions 的 32kb 有效负载大小限制吗?

  • 如果我因为想要避免 S3/Step Function 方法而感到愚蠢,那么解释为什么我的担忧没有根据的答案也将受到欢迎。

编辑

为什么您甚至考虑将获取数据和处理数据的功能拆分为两个不同的 AWS Lambda 函数?

想象一下,我有两打 Lambda 需要使用 Lambda B 的功能,而不仅仅是 Lambda A。

因此,我将 Lambda B(的功能)打包,发布到 Nexus,而我的另外两打 Lambda 都在构建时使用它。我所有的 lambdas 的大小都在膨胀,当我积累更多的“Lambda B”时,我必须发布更多的 npm 包。这是我想要避免的。

我希望我的“Lambda A”使用其他 lambda,而不是 npm 包,以实现广泛共享的功能。也许我在字面上理解“lambda 函数”中的“函数”,或者我只是想充分利用 FaaS 的潜力。

4

2 回答 2

3

从您的问题中,我可以阅读以下要求:

  • 您需要一个 AWS Lambda 函数(位于 API Gateway 后面)作为客户端应用程序的 API 端点
  • 您的 AWS Lambda 函数必须从后端系统获取数据并对其进行处理以供客户端应用程序使用
  • 此类请求是同步的,它们得到响应的速度越快越好(当然也更便宜)
  • 您需要运行的逻辑并不太复杂,可能只需几毫秒即可执行

为什么您甚至考虑将获取数据和处理数据的功能拆分为两个不同的 AWS Lambda 函数?不要把“AWS Lambda 函数”中的“函数”看得太直白:您在 AWS Lambda 函数中运行的代码可以尽可能复杂。只需在单个 AWS Lambda 函数中运行所有内容并按逻辑拆分代码。这是最有效和最干净的方式。

于 2017-12-20T19:56:00.030 回答
0

您没有告诉进程 A 和 B 之间的有效负载有多大。但如果它低于 250Kb,我建议设置一个中间 SQS 队列,其中进程 A 发布结果,进程 B 由队列中的新消息触发。

于 2019-10-27T12:49:02.443 回答