我们正在评估 Amazon Redshift 的实时数据仓库。
数据将通过 Java 服务进行流式传输和处理,并且应该存储在数据库中。我们逐行(实时)处理,每个事务我们只会插入一行。
将实时数据加载到 Amazon Redshift 的最佳做法是什么?
我们应该使用 JDBC 并执行INSERT INTO
语句,还是尝试使用 Kinesis Firehose,或者 AWS Lambda?
我担心使用其中一项服务,因为两者都将使用 Amazon S3 作为中间层并执行COPY
适用于更大数据集的命令,而不是“单行”插入。