go - 我可以在 Xeon Phi（Knight's Landing）处理器上编译 Go 程序吗？

Question

我是一个业余爱好者，喜欢在 Go 中运行我自己的程序，而且随着 Xeon Phi 处理器变得更老，它们也变得非常便宜。如此便宜，我可以从 2015/16 年开始以 <1000 美元的价格建造一台双插槽机器

我试图找出是否可以在这些上运行 Go 程序。从我所见，这个线程说他们不会运行（并尝试 gccgo），但它说它不会运行，因为它部分运行在 x87 ISA 上。令人困惑的是，在 Go 发行说明中，他们说他们将在 1.16 中放弃对 x87 的支持，这意味着过去曾支持它。我在其他线程中看到所有程序都将在兼容层上运行，但这是一个非常慢的层，只能访问 CPU 缓存的一小部分。

我觉得我离我的元素越来越远了；我想知道使用 Xeon Phi 的人是否知道它是否会运行 Go 代码？或者只是一般来说，在启动 Ubuntu（或FreeBSD，我已经看到完成并列在主板规格中的东西）之后，什么样的事情不会起作用，什么会起作用？

我感谢任何和所有的帮助！

score 4 · Accepted Answer

您的 Knight's Landing 担忧基于关于 Knight's Corner的这句话：

Knight's Corner 处理器基于 x86-64 基础，是的，但实际上它有自己的浮点指令集——没有 x87、没有 AVX、没有 SSE、没有 MMX……哦，然后你可以抛出所有当Knight's Landing（KNL）出来时，它就消失了。

“把所有的东西都扔掉”，他们的意思是所有的担忧和不相容。KNL 基于 Silvermont 并且完全兼容 x86-64（包括 x87、SSE 和 SSE2 用于执行 FP 数学的两种标准方法）。它还支持 AVX-512F、AVX-512ER 和其他一些 AVX-512 扩展，以及 AVX 和 AVX2 以及 SSE 到 SSE4.2。很像 Skylake 服务器 CPU，除了一组不同的 AVX-512 扩展。

这样做的目的正是为了解决您担心的问题：因此任何遗留二进制文件都可以在 KNL 上运行。为了从中获得良好的性能，您希望在执行繁重工作的循环中运行使用 AVX-512 向量进行向量化的代码，但 Linux 发行版的其余部分中的所有周围代码和其他程序或任何可以正常运行的程序使用任何 x87 和/或 SSE 的沼泽标准代码。

Knight's Corner（第一代商业 Xeon Phi）在基于 P5-Pentium 的内核中拥有自己的 AVX-512 变体/前身，并且没有其他 FP 硬件。

Knight's Landing（第二代商业 Xeon Phi）基于 Silvermont，配备 AVX-512，是第一个可以充当“主机”处理器（可启动）而不仅仅是协处理器的产品。

这种“主机”模式是包含足够硬件来解码和执行 x87 和 SSE 的另一个原因：如果您在 KNL 上运行整个系统，您更有可能希望执行一些旧的二进制文件以实现非性能敏感任务，不仅是专门为它编译的二进制文件。

不过，它的 x87 性能并不是很好：就像fmul每 2 个时钟一个标量 ( https://agner.org/optimize )。与每时钟 2 个 SSE mulsd（0.5c 接收吞吐量）相比。其他 SSE/AVX 数学具有相同的 0.5c 吞吐量，包括 AVX-512vfma132ps zmm在一条指令中执行 16 倍单精度融合乘加运算。

所以希望 Go 的编译器不会过多地使用 x87。在 64 位模式（C 编译器及其数学库使用）中进行标量数学的常规方法是 SSE，在 XMM 寄存器中。x86-64 C 编译器仅将 x87 用于long double.

score 0 · Accepted Answer

是的：

Xeon Phi 是英特尔设计和制造的一系列 x86 众核处理器。它旨在用于超级计算机、服务器和高端工作站。它的架构允许使用标准编程语言和应用程序编程接口 (API)，例如……另见https://en.wikipedia.org/wiki/Xeon_Phi

如果您可以在 x86 处理器上编译 go，那么您将能够在英特尔制造的特定 x86 处理器上编译。

至强不是安腾 :)

在这样的系统上，您还可以编译 go，您只需要提供合适的 c 编译器...

是什么让您认为否则您将无法编译继续说... Atari 或 Arduino？

如果你能详细说明，也许我可以进一步改进我糟糕的答案。

go - 我可以在 Xeon Phi（Knight's Landing）处理器上编译 Go 程序吗？

2 回答 2

Related

Reference