问题标签 [transactional-memory]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 在没有系统或 IO 调用的情况下休眠
对于具有硬件事务内存的场景,我需要一个不会发出任何系统或 IO 调用的睡眠(这些调用将导致中止)。睡 1 微秒usleep(1)
就好了。
这个问题建议实现嵌套循环以保持程序繁忙并延迟一段时间。但是,我希望能够通过删除这些循环的优化进行编译。
一个想法可能是计算一些复杂的数学方程。有没有办法解决这个问题?实际等待的时间不必很精确——但是对于多次运行来说,它应该是大致相同的。
c++ - 英特尔 TSX 硬件事务内存 非事务线程看到什么?
假设您有两个线程,一个创建 TSX 事务,并修改一些数据结构。另一个线程不进行任何类型的同步并读取相同的数据结构。事务对它来说是原子的吗?我实际上无法想象这可能是真的,因为如果它尝试读取由事务修改的缓存行,则无法阻止或重新启动它。
如果事务不是原子的,那么 x86 上的写入顺序规则是否仍然受到尊重?如果它看到了写#2,那么保证它必须能够看到之前的写#1。这仍然适用于作为事务的一部分发生的写入吗?
我在任何地方都找不到这些问题的答案,而且我有点怀疑 SO 上的任何人都会知道,但至少当有人发现这是一个谷歌友好的地方来提供答案时。
compiler-construction - 目前有哪些编译器支持 Haswell 事务内存?
哪些编译器(截至 2014 年 5 月)能够生成使用事务内存功能(受限事务内存,而不仅仅是锁定省略)的代码?
c - 为什么 bluegene/q 上的 XLC 编译器不支持“-qtm”?
BlueGene/q 上的 xlc 编译器有问题。xlc编译器的版本是12.1:
根据文档1,它应该支持编译器选项“-qtm”,用于启用事务内存。但是,我总是收到以下错误消息:
我怎样才能弄清楚?任何帮助表示赞赏。
x86 - Haswell Transactional Memory 读集和写集信息
最近,英特尔发布了支持硬件事务内存的 haswell 机器,称为事务同步扩展 (TSX)。
正如英特尔手册所说,推测性内存操作,写集和读集,分别缓冲在 L1 缓存和 L2 缓存中。(不完全是)
那么,我可以跟踪事务性内存操作并获取诸如地址和读/写集的值之类的信息吗?
c++ - 使用 haswell tsx 的神秘 rtm 中止
我正在尝试使用 haswell 中的 tsx 扩展,通过调整现有的中型(1000 行)代码库以使用 GCC 事务内存扩展(在这台机器中间接使用 haswell tsx)而不是粗粒度锁。我正在使用 GCC 的 transactional_memory 扩展,而不是直接编写我自己的 _xbegin / _xend。我正在使用 ITM_DEFAULT_METHOD=htm
我在让它工作得足够快时遇到了问题,因为由于神秘的原因,我得到了很高的硬件事务中止率。如下所示,这些中止不是由于冲突,也不是由于容量限制。
这是我用来量化故障率和根本原因的 perf 命令:
因此,该程序运行了一些包含事务的代码 3000 万次。每个请求涉及一个事务 gcc__transaction_atomic
块。这次运行只有一个线程。
此特定命令捕获英特尔软件开发人员手册第 3 卷perf
中描述的大多数相关 tsx 性能事件。
的输出perf stat
如下:
从输出中可以看出:
rtm_retired_start
计数为 3000 万(匹配输入到程序)rtm_retired_abort
计数大致相同(根本没有提交)- 和计数为0
abort_conflict
,abort_capacity
所以这些不是原因。另外,回想一下它只有一个线程在运行,冲突应该很少见。 - 这里唯一的实际线索是 和 的高值,
tx_exec_misc1
在rtm_retired_aborted_misc3
描述上有些相似。
英特尔手册(第 3 卷)定义了rtm_retired_aborted_misc3
计数器:
代号:C9H 20H
助记符:RTM_RETIRED.ABORTED_MISC3
描述:RTM 执行因 HLE 不友好指令而中止的次数。
的定义tx_exec_misc1
有一些类似的词:
代码:5DH 01H
助记符:TX_EXEC.MISC1
描述:计算可能导致事务中止的一类指令被执行的次数。由于这是执行计数,因此它可能并不总是导致事务中止。
我使用 perf record/perf report 使用高精度 (PEBS) 支持检查了中止的装配位置rtm_retired_aborted
。该位置具有mov
从寄存器到寄存器的指令。附近没有看到奇怪的指令名称。
更新:
从那时起,我尝试了以下两件事:
1) 我们在这里看到的 tx_exec_misc1 和 rtm_retired_aborted_misc3 签名可以得到,例如通过一个 dummy block 的形式
或其中一种形式
在这两种情况下,性能计数器看起来都与我看到的相似。但是,在这两种情况下,perf report
for都-e cpu/tx-abort/
指向直观正确的装配线:xabort
第一个示例的说明和syscall
第二个示例的说明。在真实的代码库中,性能报告指向函数开始时的堆栈推送:
我也在英特尔软件开发模拟器下运行了相同的命令。事实证明,在这种情况下问题就消失了:就应用程序而言,我没有中止。
cloud - 试用英特尔 TSX
我想尝试一下英特尔的事务性内存功能,但我不想购买全新的服务器来做这件事。是否有任何具有支持 TSX 的 CPU 的云服务?
haskell - 挂钩 GHC 运行时系统
我一直在研究事务内存是如何在 Haskell 中实现的,但我不确定我是否理解暴露给程序员的 STM 操作如何挂钩到用 C 编写的运行时系统函数中。在ghc/libraries/base/GHC/Conc/Sync.hs
git repo 中,我看到了以下定义:
然后在 中ghc/rts/PrimOps.cmm
,我看到以下 C-- 定义:
我的问题:
- 中的第一个和最后一个是什么
#
意思(# s2#, TVar tvar# #)
。我之前读过,在#
变量之后放置一个只是一个命名约定,表明某些东西是未装箱的,但是它本身意味着什么? - 我们如何从
newTVar#
到stg_newTVarzh
?似乎我错过了这两者之间的另一个定义。编译器是否重写newTVar#
为对所列 C-- 函数的调用? - C-代码中的
P_
和是什么?W_
我只能找到另一个出现的newTVar#
inghc/compiler/prelude/primops.txt.pp
根据https://ghc.haskell.org/trac/ghc/wiki/Commentary/PrimOps,这是定义原语的方式,以便编译器了解它们。
haskell - 向 Haskell 中的 STM monad 添加随机数生成
我目前正在 Haskell 中进行一些事务内存基准测试,并希望能够在事务中使用随机数。我目前正在使用此处的 Random monad/monad 转换器。在下面的示例中,我有一个包含整数的 TVar 数组和一个随机选择数组中的 10 个 tvar 进行递增的事务,例如:
我想我的问题是“这是最好的方法吗?” 似乎反过来会更自然/更有效,即将随机单子提升到 STM 单子中。每个事务进行大量的 STM 操作,很少进行随机操作。我会假设每个都会lift
增加一些开销。只做会不会更有效率lift
随机计算并单独保留 STM 计算?这甚至安全吗?似乎定义一个 STM monad 转换器会破坏我们使用 STM monad 获得的良好的静态分离属性(即,我们可以将 IO 提升到 STM monad,但是如果事务中止并呈现问题的数量)。我对 monad 转换器的了解非常有限。非常感谢有关使用变压器的性能和相对开销的简要说明。
c++ - __transaction_atomic 未启用事务内存支持
我只是在编译 C/C++ 代码,__transaction_atomic
但发生了编译器错误
[Error] __transaction_atomic' without transactional memory support enabled
代码是:
如何弄清楚?我的编译器是 GCC 4.9