我已经能够让 Tika 服务器的 Docker 预构建映像在 AWS ECS 上作为 Fargate 任务运行。我现在想让 Tika 服务器(或等效功能)在 AWS Lambda 上运行。在请求到达 Lambda 之前,请求最初会通过 AWS API Gateway(HTTP 代理集成)。我绝对理解 Lambda 在大负载(即超过 6 MB)和时间限制(最多 15 分钟)方面存在问题,但我们计划使用指定 URL 功能,我们相信 Tika 不需要 15 分钟或更长时间来提取一份文件。在 Lambda 上运行 Tika 可以实现更好、更轻松的可扩展性以及一些安全性改进。
此方法的困难在于 AWS Lambda 运行时使所有请求都通过 Lambda 处理程序函数。因此,不能只使用 Lambda 容器映像,而是使用预构建的 Lambda Docker 映像。
我可以在 Lambda 处理函数中编写一堆代码来解析进入 Lambda 的请求,然后调用相应的 Apache Tika API 作为库。但是,我相信这需要一堆代码。
另一种选择可能是对 Lambda 处理程序函数进行编码以使用 Lambda框架。然而,这个框架处于测试阶段,似乎是一个死项目(最后一次提交是在三年前)。此外,我不确定 Lambada 如何与 Tika 一起使用。
如果我想让 Tika 在 Lambda 上工作,最干净、最简单的选择是什么?