云服务(如Windows Azure SQL 数据库或AWS 大数据)提供的数据库是否能够进行分布式计算,即查询优化器在并行计算的服务器之间分配工作,类似于 MapReduce 跨节点分配计算的方式?
我在Azure 文档中没有找到任何关于此类查询优化的信息,尽管PDW似乎可以做到这一点。
云服务(如Windows Azure SQL 数据库或AWS 大数据)提供的数据库是否能够进行分布式计算,即查询优化器在并行计算的服务器之间分配工作,类似于 MapReduce 跨节点分配计算的方式?
我在Azure 文档中没有找到任何关于此类查询优化的信息,尽管PDW似乎可以做到这一点。
AWS 有 EMR(Elastic Map-Reduce),它是 AWS 提供的 Hadoop。
Azure 有 HDInsights,它是 Hortonwork 的数据平台 (Hadoop),安装在 Windows VM 上。
据我所知,微软的 PDW(并行数据仓库)不支持 map-reduce,但他们正在研究它(http://www.zdnet.com/microsofts-polybase-mashes-up-sql-server-and -hadoop-7000007424/ ) - PDW 本质上是一些带有中央管理层的 SQL Server 机器,允许在不同节点之间分区和分布数据 - 如果数据驻留在更多节点上,它可以并且将中断 PDW 节点之间的查询不止一个,但并行性本质上不是 map-reduce。