问题标签 [x87]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
assembly - 基本的 FPU 指令/堆栈概述?
我试图对 x86 上的浮点运算有一个基本的了解。我知道我们有一个带有堆栈的专用 FPU,但我没有找到太多关于堆栈在不同指令方面的行为的相关信息。
基本上,fpu 寄存器的寻址让我感到困惑。如果我指的是 st(#),我是在谈论一个特定的寄存器吗?或者它是从堆栈顶部的偏移量?
我想我的大部分问题都可以通过这个例子来回答:
如果我有一个空的 FPU 堆栈,然后运行:
结果会是:
或者:
?
请注意,它们之间的差异是 ST(1) 中的值。
optimization - 如何从 SSE 中获得最大速度?
像MXCSR这样的东西的最佳设置是什么?哪种舍入模式最快?在什么处理器上?启用信号 NaN 是否更快,以便我在计算导致 nan 时得到通知,或者这是否会导致非 NaN 计算速度变慢?
总之,您如何从紧密的内部 SSE 循环中获得最大速度?
也欢迎任何相关的 x87 浮点速度建议。
c++ - 80 位浮点数和次正规数
我正在尝试将 80 位扩展精度浮点数(在缓冲区中)转换为双精度。缓冲区基本上包含 x87 寄存器的内容。
这个问题帮助我入门,因为我对 IEEE 标准并不十分熟悉。无论如何,我正在努力寻找有关 80 位格式的次规范(或非规范化)数字的有用信息。我所知道的是,与 float32 或 float64 不同,它在尾数中没有隐藏位(没有隐含添加 1.0),因此了解数字是否标准化的一种方法是检查尾数中的最高位是否已设置. 这给我留下了以下问题:
根据维基百科告诉我的内容,float32 和 float64 表示一个(有偏的)指数为 0 且尾数非零的次正规数。
- 这在 80 位浮点数中告诉我什么?
- 尾数 < 1.0 的 80 位浮点数甚至可以有非零指数吗?
- 或者,指数为 0 的 80 位浮点数甚至可以有尾数 >= 1.0 吗?
编辑:我想问题归结为:
我可以期望 FPU 清理 x87 寄存器中的指数和最高尾数位吗?
如果不是,转换结果应该是什么数字?在那种情况下我应该完全忽略指数吗?还是qNaN?
编辑:
我阅读了英特尔手册(英特尔® 64 和 IA-32 架构软件开发人员手册,第 1 卷:基本架构)中的 FPU 部分,这没有我担心的那么可怕。事实证明,未定义以下值:
- 指数 == 0 + 设置了最高位的尾数
- 指数 != 0 + 尾数没有最高位设置
它没有提到这些值是否可以在野外出现,也没有提到它们是否在内部转换。所以我实际上掸掉了 Ollydbg 并手动设置了 x87 寄存器中的位。我制作了 ST(0) 以包含指数中设置的所有位和尾数 0。然后我让它执行
存储的值[ESP]
被转换为信号 NaN。之后FLD
,ST(0)
包含一个安静的 NaN。
我想这回答了我的问题。我接受了J-16 SDiZ的解决方案,因为它是最直接的解决方案(尽管它没有明确解释一些更精细的细节)。
总之,案子解决了。谢谢大家。
c - x87 FPOP 和 FCOM 指令 - 这些是如何工作的?
我的任务是在混合 C/ASM 中编写一个必须使用数学协处理器的简单应用程序。
如果给定点在圆柱体内(圆柱体的底位于 x=0,y=0,半径 = 5 和高度 = 10),则函数 cylinder(float x, float y, float z) 返回 1,并且如果不是,则为 0。
所以,看起来很简单。检查 z 是否在 <0,10> 内,然后检查 x^2 + y^2 < 25。
但我对 x87 的了解为零。
我写的都有。
所以我被卡住了。因此,我尝试找出可以在应用程序中使用的指令。我被卡住了,因为我在网上找到的每个教程/说明列表都写得很糟糕,我几乎什么都听不懂。
问题是,当我从数学协处理器弹出一些东西时会发生什么?我在哪里可以找到弹出的值?它是如何从 80 位值转换为 32 位值的(如果可以的话,当然) 另一个问题是,FCOM(FCOMP for pop 变体)是如何工作的?它将什么与什么(st0 到 st1 或 st1 到 st0?)进行比较,我在哪里可以看到该值是否更小/等于/更大?
谢谢你的帮助!
x86 - 反汇编“faddl”指令
在我为 x86 平台上的 32 位 Linux 编写反汇编程序的冒险中,我遇到了一个问题。当我使用以下命令反汇编一个简单的 ELF-32 可执行文件时,我看到了以下操作码序列objdump
:
但是当我查看英特尔手册时,我没有看到与此相对应的操作码。该fadd
指令以 0xDC 开头,但随后需要一个m64fp
操作数,即“内存中的内存四字操作数”。
现在,这是否意味着操作数是一个 64 位地址(这意味着该fadd
指令是一个 64 位指令,但没有以 REX 字节为前缀),或者它只是一个指向的 32 位地址到四字(64 位)?
我是否在这里遗漏了一些琐碎的事情,或者我对编码 x86 指令的理解是错误的?
opcode - 解码特定 x87 FPU 指令的歧义
关于解码 x87 FPU 指令,我面临一个模棱两可的情况。查看以下指令,取自第 2A 卷英特尔指令集手册 [1] 的第 3-380 页。
这两条指令都具有相同的单字节基本操作码0xD9
。第一条指令的扩展操作码为0x00
. 扩展操作码将在 ModR/M 字节的“reg”字段中指定。但第二条指令是一个 2 字节的操作码,具有“添加以获取寄存器”功能。这意味着:
关于区分这两个指令,我有一个小问题。一个小例子是:
现在,假设我得到了操作码序列"D9 C1"
。如果我需要检查它是否是指令"FLD m32fp"
,那么我必须检查 ModR/M 字节的“reg”字段是否为 0x00。如果是这样,那么它确实是"FLD m32fp"
正在使用的指令。
的二进制表示C1
是"1100 0001"
。假设 bit0 为 LSB,则 bit3-bit5(含)构成 ModR/M 字节的“reg”字段"C1"
。我们看到它确实是0x00
(3 个零)。
所以我将操作码序列映射"D9 C1"
到"FLD m32fp"
指令。进一步解码,我们看到操作数实际上变成"ecx"
了这种情况。但是我们看到它"FLD ST1"
也有操作码序列"D9 C1"
,这是用于该操作码序列的实际指令。
本质上,我如何确定操作码序列"D9 C1"
对应于指令"FLD ST1"
而不是"FLD ecx"
?
指令也出现了非常相似的问题"FMUL"
,因为使用操作数的方式与"FLD"
此处相同。
[1] http://www.intel.com/design/intarch/manuals/243191.HTM
谢谢和问候,
Hrishikesh Murali
assembly - 组装 8086;浮点数,加,减
我需要一些资源来了解更多关于浮点数的信息,我需要在emu8086环境中为这类数字编写加法和减法运算......
任何帮助深表感谢
assembly - 装配。如何设置CW的RC位?
如何将RC中FPU位的控制字设置为3?
答案(编者注:不要将答案作为问题的一部分发布,但现在就在这里)
assembly - 如何在 x86 汇编中划分浮点数?
当我尝试编写 Heron 算法从 ECX 寄存器中计算 sqrt 时,它不起作用。看起来问题是除法浮点数,因为结果是整数。
我的算法:
floating-point - nasm浮点错误
致力于对浮点堆栈进行操作:
出于某种原因,如果我注释掉得到的方程eq2
,我将在前面的方程中得到正确的输出得到res1
,
但如果我不加注释等式 2,我将得到 a0
作为输出
下一个方程也是一样的,如果在前一个方程之后有一个函数,出于某种原因,它会将其归零。
以前有人遇到过这个问题吗?
这是打印功能