4

我知道英特尔至强 phi 协处理器 SE10X 有 61 个内核,建议仅使用 60 个内核,因为卸载守护进程使用了​​ 1 个内核。另外,由于intel xeon phi协处理器5110P有60核,是否建议使用59核?

4

3 回答 3

3

从此这个 MIC 相关的常见问题解答

合理的亲和力

在英特尔 MPSS 下,许多内核服务和守护进程都与最后一个物理内核“引导处理器”(BSP) 相关联。这也是卸载守护程序运行支持卸载数据传输所需的服务的地方。因此,避免将此内核用于用户代码通常是明智的。(事实上​​,正如已经讨论过的,卸载系统通过从卸载进程的默认关联中删除最后一个核心上的逻辑 CPU 来自动执行此操作)。

这个 OpenMP on MIC 指南

卸载程序继承了一个隐藏最后一个核心的关联映射,该核心专用于卸载系统功能。本机程序可以使用所有内核,使得平衡线程所需的计算略有不同。

这些资源都不是特定于任何 MIC 模型的,它们与架构有关;所以看起来如果你卸载到设备并且不使用默认的亲和力,你确实应该避免使用最后一个核心。

于 2013-06-10T06:40:14.133 回答
1

当您在卸载模式下执行工作负载时(当应用程序在 CPU 上运行并将一些计算卸载到 Xeon Phi)时,建议保留 1 个内核用于卸载运行时。Xeon Phi 端有一个 COI 恶魔,它运行四个服务线程来管理卸载活动。请记住,至强融核上的 1 个物理内核运行 4 个硬件线程。在应用程序直接在 Xeon Phi 卡上启动时的本机执行模型的情况下,您可以使用所有可用的内核。由于现在有任何卸载活动。

于 2015-03-17T14:25:50.633 回答
1

我在英特尔至强 phi 7120p 卡上评估了我的测试代码的性能。我观察到代码性能在没有时是最好的。线程数是(核心数 - 1)的倍数。这是因为其中一个内核正忙于运行 Linux 微操作系统服务。

一般来说:

No. of threads to create >= K * T * (N-1)
K = Positive integer (=2 works fine)  
T = No. of thread contexts on hardware(4 in my case)  
N = No. of cores present on hardware.  
于 2014-06-20T12:32:22.417 回答