我正在考虑使用 Apache Spark 进行数据分析。过去,由于 NUMA 架构和对象位于单个节点的本地,我在 4 插槽服务器上经历过 Java/Scala 速度下降。解决方案是为每个 NUMA 节点启动一个单独的固定 JVM,并让它们使用 Akka 相互通信。
在 Spark 中如何处理 NUMA 以避免类似情况?
我正在考虑使用 Apache Spark 进行数据分析。过去,由于 NUMA 架构和对象位于单个节点的本地,我在 4 插槽服务器上经历过 Java/Scala 速度下降。解决方案是为每个 NUMA 节点启动一个单独的固定 JVM,并让它们使用 Akka 相互通信。
在 Spark 中如何处理 NUMA 以避免类似情况?