database - 将 MapReduce 与云数据库服务进行比较

Question

云服务（如Windows Azure SQL 数据库或AWS 大数据）提供的数据库是否能够进行分布式计算，即查询优化器在并行计算的服务器之间分配工作，类似于 MapReduce 跨节点分配计算的方式？

我在Azure 文档中没有找到任何关于此类查询优化的信息，尽管PDW似乎可以做到这一点。

score 1 · Accepted Answer

AWS 有 EMR（Elastic Map-Reduce），它是 AWS 提供的 Hadoop。

Azure 有 HDInsights，它是 Hortonwork 的数据平台 (Hadoop)，安装在 Windows VM 上。

据我所知，微软的 PDW（并行数据仓库）不支持 map-reduce，但他们正在研究它（http://www.zdnet.com/microsofts-polybase-mashes-up-sql-server-and -hadoop-7000007424/ ) - PDW 本质上是一些带有中央管理层的 SQL Server 机器，允许在不同节点之间分区和分布数据 - 如果数据驻留在更多节点上，它可以并且将中断 PDW 节点之间的查询不止一个，但并行性本质上不是 map-reduce。

database - 将 MapReduce 与云数据库服务进行比较

1 回答 1

Related

Reference