我正在尝试在 Microsoft Azure 数据仓库之上构建实时报告服务。目前我有一个大约 5 TB 数据的 SQL 服务器。我想将数据流式传输到数据仓库,并使用 Azure DW 的计算能力生成基于数据的实时报告。是否有任何准备好使用/最佳实践来做到这一点?
我正在考虑的一种方法是将数据加载到 Kafka 中,然后通过 Spark 流将其流式传输到 Azure DW。然而,这种方法比实时更接近实时。有什么方法可以利用 SQL Server Change Data Capture 将数据流式传输到数据仓库中?