apache-kudu - KUDU for JDBC replication purposes, but not for Off-loaded Analytics

Question

Given the quote from Apache KUDU official documentation, namely: https://kudu.apache.org/overview.html

Kudu isn't designed to be an OLTP system, but if you have some subset of data which fits in memory, it offers competitive random access performance. We've measured 99th percentile latencies of 6ms or below using YCSB with a uniform random access workload over a billion rows. Being able to run low-latency online workloads on the same storage as back-end data analytics can dramatically simplify application architecture.

Does this statement imply that KUDU can be used for replication from a JDBC source - the simplest form possible?

score 0 · Accepted Answer

在其他地方，我使用 KUDU 从 SAP 和其他 COTS 进行复制，以便报告可以针对 KUDU 表而不是 Hana 表运行。那是别人决定的架构。

对于数据的纯复制，主要用于从数据湖中提取的后续数据，对于具有修饰历史且大小 < 1TB 的数据，这也是可行的。Cloudera 在讨论后证实了这一点。尽管 KUDU 具有列格式并且需要行格式，但它也可以正常工作。

apache-kudu - KUDU for JDBC replication purposes, but not for Off-loaded Analytics

1 回答 1

Related

Reference