Apache Drill 有自己的柱状表示,如 Apache Arrow。但是 Apache Arrow 支持更多的编程语言。我期待使用 Apache Drill,但我仍然想要 Apache Arrow 的编程语言支持。
一些消息来源说,Apache Arrow 源于 Apache Drill 的 ValueVectors。
Drill 在内部将数据表示为 JSON 文档——类似于 MongoDB 和 Elasticsearch。这些 JSON 文档被“分解”成列,这允许 Drill 提供列分析的性能增强,但保留查询复杂数据的能力。请注意,此内部表示不基于 Apache Arrow。-来源
为什么 Apache Drill 不能使用 Apache Arrow 项目?Drill 的内部表示与 Apache Arrow 有何不同,Arrow 与 Drill 的 ValueVectors 相比有什么优势,反之亦然。