5

我目前正在处理 AT&T Assembly 的任务,现在我必须附加两个字符串:

message: .asciz "String 1"
before: .asciz "String 2"

我真的不知道如何做到这一点或如何开始。我已经在互联网上搜索过,但找不到任何有用的信息。我想我必须手动将第二个字符串的字符复制到第一个字符串的末尾,但我不确定。

谁能向我解释如何做到这一点?:)

4

2 回答 2

7

这个问题没有提到目标记忆,这使得它有点难以回答。我也不知道你是16位,32位还是64位。为方便起见,我还假设它们是 C 风格的 0 终止字符串。

无论如何,这似乎是一般程序:

  • 获取第一个字符串的长度(有关编写 asm strlen 的说明可在此处找到:http: //www.int80h.org/strlen/
  • 将ptr设置为目标内存
  • rep(e/ne) movsb使用ecx 中的大小将第一个字符串复制到目标内存。

这可以通过首先使用 'movsd' 进行 CPU 优化shr ecx, 2对你的长度做一个4字节的批次,然后用movsb做剩余部分。我见过这样做:

mov     edi, dest
mov     esi, string_address
mov     ecx, string_length
mov     eax, ecx
shr     ecx, 2
repne movsd
mov     cl, al
and     cl, 3
repne movsb ; esi and edi move along the addresses as they copy, meaning they are already set correctly here
  • 获取第二个字符串的长度(如果需要,请务必在堆栈或其他寄存器中备份您的 edi;它包含您需要将下一个字符串复制到的地址)
  • 将第二个字符串复制到目标内存(我说过,正确的地址应该在第一个字符串操作后的edi中)
  • 为安全起见,在其后面添加一个新的 0。

如果要将第二个字符串复制到第一个字符串的末尾,则需要少做一次复制操作,但必须确保那里实际上有足够的空间来复制第二个字符串,而不会覆盖其他重要内容。

于 2012-07-04T17:21:27.487 回答
2

这不是一件小事。字符串的长度是可变的,并且在内存中占据不同的空间,并且必须有一些方法可以知道它们有多长或它们在哪里结束。对于 C 或 C++,一个 nul 字节(零值字节)表示字符串的结尾。对于其他一些程序语言,您有一个指向字符串开头的指针和单独存储的字符串长度,这具有让您在字符串中存储二进制(包括零值字节)的优势。即使使用 C 和其他语言,您也必须有一个指向字符串开始位置的指针。

通常必须发生的是,您必须使用 asm 联系操作系统并请求当前空闲的内存块,该内存块大到足以包含两个字符串的内容,一旦它们被附加。这将是与开头的两个字符串中的任何一个分开的内存,它来自所谓的内存堆,一旦给定了该内存块的起点,您就可以将第一个字符串的内容复制到其中, 然后你继续复制第二个字符串的内容,就在第一个字符串的后面。然后释放已分配给第一个字符串的内存,并通过更改其指针和可能的长度将块重新分配给该字符串。释放的内存由操作系统返回到内存堆以供其他地方重用。

实际上,操作系统并不是释放内存的唯一来源。一些编译器,甚至是汇编器,要么自己处理内存管理,要么在需要时为程序员提供合适的工具来完成。

换句话说,这可能是一项非常雄心勃勃的事业,你必须对正在发生的事情有相当多的了解才能把它做好。您做错了,您可能会遇到诸如系统崩溃和需要重新启动之类的后果。

于 2012-08-14T23:07:06.827 回答