我有一台机器可以部署 Spark、Hadoop 和 Tachyon。来自 hdfs/tachyon 的 spark 操作在一个节点上是否会更快,所有内核/RAM 或多个 VM 节点均分资源?内存 < 200GB。
Spark 中广播的性能和可扩展性已经很老了,但表明网络流量的增加可能对all vs VM 的问题产生很大的负面影响。
我有一台机器可以部署 Spark、Hadoop 和 Tachyon。来自 hdfs/tachyon 的 spark 操作在一个节点上是否会更快,所有内核/RAM 或多个 VM 节点均分资源?内存 < 200GB。
Spark 中广播的性能和可扩展性已经很老了,但表明网络流量的增加可能对all vs VM 的问题产生很大的负面影响。