是否有一个类似于 Vertica 的列存储,它是建立在 Hadoop 之上的。我不是在谈论 HBase,因为它是稀疏矩阵存储,并且无法获得像 Vertica 这样的东西可以实现的压缩级别?
谢谢
是否有一个类似于 Vertica 的列存储,它是建立在 Hadoop 之上的。我不是在谈论 HBase,因为它是稀疏矩阵存储,并且无法获得像 Vertica 这样的东西可以实现的压缩级别?
谢谢
你在寻找类似RCFile的东西吗?它是一种在内部使用列式存储的文件类型。
我没有使用过 Hadoop,但我知道 Vertica 一直在尝试与 Hadoop 集成。
http://www.vertica.com/the-analytics-platform/native-bi-etl-and-hadoop-mapreduce-integration/
看看 Hadapt http://hadapt.com/
这是 HadoopDB 的商业版本http://db.cs.yale.edu/hadoopdb/hadoopdb.html 在耶鲁大学开发。它可以与面向列的数据库(安装在计算机集群的每个节点上)一起使用,同时利用 Hadoop 进行容错执行。