问题标签 [assembly]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
10 回答
26926 浏览

c - 在x86上将float转换为int的最快方法是什么

您知道在 x86 CPU 上将浮点数转换为 int 的最快方法是什么。对于以下任意组合,最好在 C 或程序集中(可以在 C 中内联):

  • 32/64/80 位浮点数 -> 32/64 位整数

我正在寻找一些比让编译器更快的技术。

0 投票
3 回答
1078 浏览

macos - Mac (68000) 汇编程序的名称是什么?

我敢肯定有几个,但是当您彻底崩溃计算机时,我正在考虑的那个会显示一个漂亮的文本屏幕。

文本是“好吧,给我抽个腌鱼。”

0 投票
4 回答
5442 浏览

c++ - ARM 上的预取指令

较新的 ARM 处理器包括 PLD 和 PLI 指令。

我正在编写紧密的内部循环(在 C++ 中),它具有非顺序内存访问模式,但我的代码自然可以完全理解这种模式。如果我可以在处理当前内存位置的同时预取下一个位置,我预计会大大加快速度,并且我希望这足够快,值得尝试!

我正在使用来自 ARM 的新的昂贵编译器,它似乎没有在任何地方包含 PLD 指令,更不用说在我关心的这个特定循环中了。

如何在我的 C++ 代码中包含显式预取指令?

0 投票
3 回答
2032 浏览

x86 - 你会从 DOS 挂起什么中断来获取实时时钟

你会从 DOS 挂起什么中断来获取实时时钟?

0 投票
11 回答
32274 浏览

assembly - 如何使用 x86 汇编语言将两个 64 位数字相乘?

我该怎么去...

  • 将两个 64 位数字相乘

  • 两个 16 位十六进制数相乘

...使用汇编语言。

我只能使用寄存器 %eax、%ebx、%ecx、%edx 和堆栈。

编辑:哦,我在 x86 上使用 ATT 语法
EDIT2:不允许反编译成程序集...

0 投票
9 回答
14589 浏览

algorithm - 汇编语言中的伪随机生成器

我需要一个用于课程中分配的汇编程序的伪随机数生成器算法,我更喜欢一个简单的算法。但是,我不能使用外部库。

什么是用于组装的好的、简单的伪随机数生成器算法?

0 投票
5 回答
1325 浏览

assembly - 什么会导致汇编语言程序显示“垃圾”?

我有一些代码应该显示一条短消息。这是相关的代码:

输出是:

这里发生了什么?

0 投票
2 回答
1777 浏览

assembly - Grub 并进入实模式(低级汇编语言编程)

我一直在开发一个玩具操作系统,并且一直在使用 grub 作为我的引导加载程序。最近在尝试使用 VGA 时,我发现我无法使用硬件中断。我发现这是因为我被 grub 置于保护模式。

有谁知道如何在不必摆脱 grub 的情况下回到实模式?

0 投票
1 回答
8682 浏览

pointers - MIPS 汇编指针指向指针?

我想我知道如何处理这个案子,但我只是想确保我做对了。假设您有以下 C 代码:

P 包含一个地址,该地址指向内存中具有另一个地址的位置。我想修改第二个地址。所以MIPS代码:

你会这样做吗?

0 投票
6 回答
9177 浏览

c++ - 我在哪里可以找到世界上最快的 atof 实施?

我正在寻找针对美国英语语言环境、ASCII 和非科学记数法优化的 IA32 上极快的 atof() 实现。windows 多线程 CRT 在每次调用 isdigit() 时都会检查语言环境的变化,因此在这里很糟糕。我们目前的最佳表现源自 perl + tcl 的 atof 实现中的最佳表现,其性能比 msvcrt.dll 的 atof 高出一个数量级。我想做得更好,但我没有想法。BCD 相关的 x86 指令似乎很有希望,但我无法让它胜过 perl/tcl C 代码。任何 SO'ers 都可以挖掘到最好的链接吗?也欢迎基于非 x86 汇编的解决方案。

基于初步答案的澄清:

对于此应用程序,~2 ulp 的不准确性很好。
要转换的数字将小批量通过网络以 ascii 消息的形式到达,我们的应用程序需要以尽可能低的延迟进行转换。