问题标签 [intel-tsx]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
2288 浏览

x86 - 像 CLR 和 JVM 这样的运行时是否能够使用 Haswell TSX 指令?

在阅读Anandtech 关于“Haswell TSX”(事务性内存屏障)后,我立即想知道 CLR/JVM 是否能够在 C#/Java/Scala/F# 中将这些用于高度并行的应用程序(C# Rx/TPL/TFD)。

0 投票
1 回答
722 浏览

assembly - 模拟 Intel TSX 指令

我想在芯片可用之前试用新的 Intel TSX 指令。英特尔是否提供了仿真器,或者是否有其他一些被广泛使用的技术?

0 投票
0 回答
718 浏览

x86 - 禁用硬件锁定消除

我试图让硬件事务内存 [TSX] 的利润在一个小应用程序中可见。编译器自动对互斥锁使用硬件锁省略 [HLE],这不是我当时想要的。有没有办法使用 icc 在 Haswell 处理器上禁用自动硬件锁定消除?

到目前为止,谷歌和英特尔文档没有帮助。

0 投票
2 回答
216 浏览

c++ - haswell RTM 中使用的 isLocked 方法

我目前正在使用 Intel Haswell RTM(事务内存的硬件支持)开发应用程序。从我在这里这里看到的情况来看,推荐的过程是使用某种回退锁,以防事务中止。

推荐的流程如下:

我的问题是 isLocked() 函数。到目前为止,我还没有找到任何提供此功能的主流库/类(如这里所见,大多数情况下它是无用的)。你有什么建议?

谢谢!

0 投票
1 回答
547 浏览

c++ - 英特尔 TSX 硬件事务内存 非事务线程看到什么?

假设您有两个线程,一个创建 TSX 事务,并修改一些数据结构。另一个线程不进行任何类型的同步并读取相同的数据结构。事务对它来说是原子的吗?我实际上无法想象这可能是真的,因为如果它尝试读取由事务修改的缓存行,则无法阻止或重新启动它。

如果事务不是原子的,那么 x86 上的写入顺序规则是否仍然受到尊重?如果它看到了写#2,那么保证它必须能够看到之前的写#1。这仍然适用于作为事务的一部分发生的写入吗?

我在任何地方都找不到这些问题的答案,而且我有点怀疑 SO 上的任何人都会知道,但至少当有人发现这是一个谷歌友好的地方来提供答案时。

0 投票
1 回答
237 浏览

compiler-construction - 目前有哪些编译器支持 Haswell 事务内存?

哪些编译器(截至 2014 年 5 月)能够生成使用事务内存功能(受限事务内存,而不仅仅是锁定省略)的代码?

0 投票
2 回答
137 浏览

x86 - Haswell Transactional Memory 读集和写集信息

最近,英特尔发布了支持硬件事务内存的 haswell 机器,称为事务同步扩展 (TSX)。

正如英特尔手册所说,推测性内存操作,写集和读集,分别缓冲在 L1 缓存和 L2 缓存中。(不完全是)

那么,我可以跟踪事务性内存操作并获取诸如地址和读/写集的值之类的信息吗?

0 投票
1 回答
853 浏览

c++ - 使用 haswell tsx 的神秘 rtm 中止

我正在尝试使用 haswell 中的 tsx 扩展,通过调整现有的中型(1000 行)代码库以使用 GCC 事务内存扩展(在这台机器中间接使用 haswell tsx)而不是粗粒度锁。我正在使用 GCC 的 transactional_memory 扩展,而不是直接编写我自己的 _xbegin / _xend。我正在使用 ITM_DEFAULT_METHOD=htm

我在让它工作得足够快时遇到了问题,因为由于神秘的原因,我得到了很高的硬件事务中止率。如下所示,这些中止不是由于冲突,也不是由于容量限制。

这是我用来量化故障率和根本原因的 perf 命令:

因此,该程序运行了一些包含事务的代码 3000 万次。每个请求涉及一个事务 gcc__transaction_atomic块。这次运行只有一个线程。

此特定命令捕获英特尔软件开发人员手册第 3 卷perf中描述的大多数相关 tsx 性能事件。

的输出perf stat如下:

从输出中可以看出:

  • rtm_retired_start计数为 3000 万(匹配输入到程序)
  • rtm_retired_abort计数大致相同(根本没有提交)
  • 和计数为0 abort_conflictabort_capacity所以这些不是原因。另外,回想一下它只有一个线程在运行,冲突应该很少见。
  • 这里唯一的实际线索是 和 的高值,tx_exec_misc1rtm_retired_aborted_misc3描述上有些相似。

英特尔手册(第 3 卷)定义了rtm_retired_aborted_misc3计数器:

代号:C9H 20H

助记符:RTM_RETIRED.ABORTED_MISC3

描述:RTM 执行因 HLE 不友好指令而中止的次数。

的定义tx_exec_misc1有一些类似的词:

代码:5DH 01H

助记符:TX_EXEC.MISC1

描述:计算可能导致事务中止的一类指令被执行的次数。由于这是执行计数,因此它可能并不总是导致事务中止。

我使用 perf record/perf report 使用高精度 (PEBS) 支持检查了中止的装配位置rtm_retired_aborted。该位置具有mov从寄存器到寄存器的指令。附近没有看到奇怪的指令名称。

更新:

从那时起,我尝试了以下两件事:

1) 我们在这里看到的 tx_exec_misc1 和 rtm_retired_aborted_misc3 签名可以得到,例如通过一个 dummy block 的形式

或其中一种形式

在这两种情况下,性能计数器看起来都与我看到的相似。但是,在这两种情况下,perf reportfor都-e cpu/tx-abort/ 指向直观正确的装配线:xabort第一个示例的说明和syscall第二个示例的说明。在真实的代码库中,性能报告指向函数开始时的堆栈推送:

我也在英特尔软件开发模拟器下运行了相同的命令。事实证明,在这种情况下问题就消失了:就应用程序而言,我没有中止。

0 投票
1 回答
167 浏览

delphi - 英特尔 TSX 与 Delphi

我想在Intel TSXDelphi 中使用同步扩展。但是 AFAIK Delphi 不支持过去的任何扩展程序集SSE 4.2,所以可以以其他方式完成吗?以及如何去检测这样的特征。

自 2012 年以来,Haswell 处理器支持此功能。

0 投票
1 回答
145 浏览

cloud - 试用英特尔 TSX

我想尝试一下英特尔的事务性内存功能,但我不想购买全新的服务器来做这件事。是否有任何具有支持 TSX 的 CPU 的云服务?