TL:DR:如果您在 UP 系统上禁用中断,那么任何事情都是原子的,只要您不计算使用 DMA 观察内存的系统设备。
注意intr_disable ();
/intr_set_level (old_level);
周围的操作。
现代 CPU 保证对齐的内存操作是原子的
对于多线程观察者,这仅适用于单独的加载或存储,而不适用于读取-修改-写入操作。
对于原子性的东西,我们必须考虑我们关心的潜在观察者。重要的是,没有任何东西可以观察到操作已部分发生。实现这一点的最直接方法是使操作在物理/电气上是瞬时的,并同时影响所有位(例如,并行总线上的加载或存储在时钟周期的边界从未开始到完成,所以它是原子的“免费”直到并行总线的宽度)。这对于 read-modify-write 是不可能的,我们能做的最好的就是阻止观察者在加载和存储之间查看。
我对 x86上的原子性的回答以不同的方式解释了同一件事,即原子的含义。
在单处理器 (UP) 系统中,唯一的异步观察者是其他系统设备(例如 DMA)和中断处理程序。如果我们可以排除非 CPU 观察者写入信号量,那么我们关心的只是中断的原子性。
此代码采用简单的方法并禁用中断。这没有必要(或者至少如果我们用 asm 编写就不会)。
中断是在两条指令之间处理的,而不是在一条指令的中间。机器的架构状态要么包括内存减量,要么不包括,因为dec [mem]
要么运行要么没有。我们实际上不需要lock dec [mem]
这个。
顺便说一句,这是cmpxchg
没有lock
前缀的用例。我一直想知道为什么他们不只是lock
隐含在 中cmpxchg
,原因是 UP 系统通常不需要lock
前缀。
此规则的例外是可以记录部分进度的可中断指令,例如rep movsb
或vpgather
/vpscatter
参见执行中间的中断指令 这些不会是原子的。即使唯一的观察者是同一内核上的其他代码,也会中断。只会发生或不发生 的单个迭代rep whatever
,或者聚集或分散的单个元素。
大多数 SIMD 指令无法记录部分进度,例如vmovdqu ymm0, [rdi]
,从它运行的核心的 PoV 中要么完全发生,要么根本不发生。(但当然不能保证原子性。系统中的其他观察者,如 DMA 或 MMIO 或其他内核。这就是正常的加载/存储原子性保证很重要的时候。)
没有可靠的方法来确保编译器发出dec [value]
而不是这样的:
mov eax, [value]
;; interrupt here = bad
dec eax
;; interrupt here = bad
mov [value], eax
ISO C11 / C++11 没有提供一种方法来请求关于信号处理程序/中断的原子性,但不提供其他线程。它们确实提供atomic_signal_fence
了编译器屏障(相对于 thread_fence 作为屏障 wrt. 其他线程/核心),但屏障不能创建原子性,只能控制排序 wrt。其他操作。
C11/C++11volatile sig_atomic_t
确实有这个想法,但它只为单独的加载/存储提供原子性,而不是 RMW。 它是x86 Linux 上的 typedef 。int
请参阅该问题以获取标准的一些引用。
在特定实现上,gcc -Wa,-momit-lock-prefix=yes
将省略所有锁定前缀。( GAS 2.28 docs ) 如果您的代码不包含需要在 MMIO 位置上执行原子 RMW 或使用 dummylock add
作为设备驱动程序硬件访问,这对于单线程代码或单处理器机器是安全的更快mfence
。
但这在需要在 SMP 机器上运行的多线程程序中是不可用的,如果线程之间有一些原子 RMW 以及线程和信号处理程序之间有一些原子 RMW。