我们知道,在今天的英特尔处理器中,内核之间的共享是通过缓存 L3。L3 缓存部分之间的交换是在环总线上(修改后的 QPI),因此延迟越大,彼此的核心越远(在环上)。是否有减少内核之间交换延迟的最佳实践?
一个例子:我们在单个进程中组合了少量数据交换的线程。然后操作系统会将同一进程的所有线程放置在相邻的内核中。
我们知道,在今天的英特尔处理器中,内核之间的共享是通过缓存 L3。L3 缓存部分之间的交换是在环总线上(修改后的 QPI),因此延迟越大,彼此的核心越远(在环上)。是否有减少内核之间交换延迟的最佳实践?
一个例子:我们在单个进程中组合了少量数据交换的线程。然后操作系统会将同一进程的所有线程放置在相邻的内核中。