我们正在基于 Data Lake 架构松散地建立一个数据平台。我们正在评估提供集中数据目录和元数据管理和标记的候选人。Glue 看起来很有前途,但它仍然没有供公众使用,所以我们研究了
- 地面
- 吃水线
- 扎洛尼
地面相当DYI。看来我们必须广泛扩展它才能使它为我们工作。(从 S3 清除,写给 Titan)
Waterline 和 Zaloni 是打包的完整解决方案,可能不是我们想要的,因为我们更喜欢开源的点解决方案。
有没有我们应该寻找的替代方案?我们喜欢 Ground 中可用的 MetaModel,并倾向于将其与 Kinesis 模式管理一起使用。