46

我想以编程方式禁用硬件预取。

使用硬件实现的预取器优化英特尔® 酷睿™ 微架构上的应用程序性能以及 如何在 32 位英特尔® 架构上选择硬件和软件预取,我需要更新 MSR 以禁用硬件预取。

这是一个相关的片段:

“DPL Prefetch 和 L2 Streaming Prefetch 设置也可以通过编写用于更改IA32_MISC_ENABLE 寄存器中的位的设备驱动程序实用程序以编程方式更改 -MSR 0x1A0此类实用程序提供启用或禁用预取机制的能力,而无需任何服务器停机时间。

下表显示了为了控制和 L2 流预取IA32_MISC_ENABLE MSR而必须更改的位:DPL

Prefetcher Type MSR (0x1A0) Bit Value 
DPL (Hardware Prefetch) Bit 9 0 = Enable 1 = Disable 
L2 Streamer (Adjacent Cache Line Prefetch) Bit 19 0 = Enable 1 = Disable"

我尝试使用http://etallen.com/msr.html但这不起作用。我也尝试过直接使用wrmsrinasm/msr.h但那是段错误。我尝试在内核模块中执行此操作......并杀死了机器。

顺便说一句 - 我使用的是内核 2.6.18-92.el5,它已MSR链接到内核中:

$ grep -i msr /boot/config-$(uname -r)
CONFIG_X86_MSR=y
...
4

4 回答 4

27

您可以使用 msr-tools http://www.kernel.org/pub/linux/utils/cpu/msr-tools/启用或禁用硬件预取器 。

以下启用硬件预取器(通过取消设置位 9):

[root@... msr-tools-1.2]# ./wrmsr -p 0 0x1a0 0x60628e2089 
[root@... msr-tools-1.2]# ./rdmsr 0x1a0 
60628e2089

以下禁用硬件预取器(通过启用位 9):

[root@... msr-tools-1.2]# ./wrmsr -p 0 0x1a0 0x60628e2289 
[root@... msr-tools-1.2]# ./rdmsr 0x1a0 
60628e2289

以编程方式,您可以通过打开/dev/cpu/<cpunumber>/msr并使用 pwrite 在偏移处写入 msr“文件”来以root 身份执行此操作0x1a0

于 2009-04-24T22:10:13.033 回答
13

来自 Intel 参考:
该指令必须在特权级 0 或实地址模式下执行;否则,将生成一般保护异常#GP(0)。在 ECX 中指定保留或未实现的 MSR 地址也会导致一般保护异常。

...
在使用该指令之前,应使用 CPUID 指令确定是否支持 MSR(EDX[5]=1)。

因此,您的错误可能与不支持 MSR 的 CPU 或使用错误的 MSR 地址有关。

在内核源码中有很多使用MSR的例子:

在内核源码中,对于单个cpu,它在arch/i386/kernel/cpu/intel.c中演示了禁用Xeon的预取,在函数中:

static void __cpuinit Intel_errata_workarounds(struct cpuinfo_x86 *c)

rdmsr 函数参数是 msr 编号、指向低 32 位字的指针和指向高 32 位字的指针。
wrmsr 函数参数是 msr 编号、低 32 位字值和高 32 位字值。

多核或 smp 系统必须将 cpu 结构作为第一个参数传入:
void rdmsr_on_cpu(unsigned int cpu, u32 msr_no, u32 *l, u32 *h);
无效 wrmsr_on_cpu(无符号整数 cpu,u32 msr_no,u32 l,u32 h);

于 2009-04-24T09:10:54.933 回答
4

2014 年,英特尔发布了有关使用 0x1a4 msr (1a4 msr) 禁用 Nehalem、Westmere、Sandy Bridge、Ivy Bridge、Haswell、Broadwell(可能还有更新的内核)的硬件预取器的信息。bholanath 在这里找到了链接:

https://software.intel.com/en-us/articles/disclosure-of-hw-prefetcher-control-on-some-intel-processors披露一些英特尔处理器上的硬件预取器控制 - Vish Viswanathan(英特尔) , 2014 年 9 月 24 日

本文公开了 MSR 设置,可用于控制基于以下微架构的英特尔处理器上可用的各种硬件预取器:Nehalem、Westmere、Sandy Bridge、Ivy Bridge、Haswell 和 Broadwell。

上述处理器支持 4 种类型的硬件预取器来预取数据。有 2 个与 L1 数据缓存相关的预取器(也称为 DCU DCU 预取器、DCU IP 预取器)和 2 个与 L2 缓存相关的预取器(L2 硬件预取器、L2 相邻缓存行预取器)

每个内核上都有一个型号特定寄存器 (MSR),地址为 0x1A4,可用于控制这 4 个预取器。该寄存器中的位 0-3 可用于启用或禁用这些预取器。该 MSR 的其他位被保留。

它们对于每个 CPU 内核都是本地的,并且可以在msrlinux 内核驱动程序的帮助下由 root 更改。英特尔使用它们通过英特尔 MLC 工具测量 NUMA 中的内存延迟:

For example, Intel Memory Latency Checker tool (http://www.intel.com/software/mlc) modifies the prefetchers through writes to MSR 0x1a4 to measure accurate latencies and restores them to the original state on exit.

于 2017-01-29T02:57:14.020 回答
2

我在这里添加一个答案,因为以前的答案可能不适用于所有英特尔处理器。

对于我的 Intel Xeon 5650(06_2CH 系列)处理器,手册第 35 章指定地址 0x1A0 处的寄存器 IA32_MISC_ENABLE 的位 10 到 8 被保留。我想这意味着我无法通过 MSR 打开和关闭预取器。

根据此处英特尔员工的回答:“英特尔尚未披露如何禁用 Nehalem 之后的处理器上的预取器。您需要使用 BIOS 中的选项来禁用预取器。”

于 2014-01-27T14:14:30.680 回答