我的用例如下:我有 JSON 数据进来,需要以 parquet 格式存储在 S3 中。到目前为止一切顺利,我可以在 Glue 中创建一个模式并将“DataFormatConversionConfiguration”附加到我的 firehose 流中。但是数据来自不同的“主题”。每个主题都有一个特定的“模式”。据我了解,我将不得不创建多个 firehose 流,因为一个流只能有一个模式。但是我有成千上万个这样的主题,传入的数据量非常大。创建这么多的 firehose 资源( https://docs.aws.amazon.com/firehose/latest/dev/limits.html)看起来并不可行
我应该如何构建我的管道。