966

模拟器是如何工作的?当我看到 NES/SNES 或 C64 仿真器时,我感到很震惊。

http://www.tommowalker.co.uk/snemzelda.png

您是否必须通过解释其特定的汇编指令来模拟这些机器的处理器?还有什么内容?它们通常是如何设计的?

您能给有兴趣编写模拟器(尤其是游戏系统)的人提供任何建议吗?

4

16 回答 16

1121

仿真是一个多方面的领域。以下是基本思想和功能组件。我将把它分成几部分,然后通过编辑填写详细信息。我将要描述的许多事情都需要了解处理器的内部工作原理——汇编知识是必要的。如果我对某些事情有点含糊不清,请提出问题,以便我可以继续改进这个答案。

基本思路:

仿真通过处理处理器和各个组件的行为来工作。您构建系统的每个单独部分,然后像硬件中的电线一样连接这些部分。

处理器仿真:

处理处理器仿真的三种方法:

  • 解释
  • 动态重新编译
  • 静态重新编译

通过所有这些路径,您有相同的总体目标:执行一段代码来修改处理器状态并与“硬件”交互。处理器状态是给定处理器目标的处理器寄存器、中断处理程序等的集合。对于 6502,您将有许多 8 位整数表示寄存器:AXYPS; 你也会有一个 16 位的PC寄存器。

通过解释,您从IP(指令指针——也称为PC程序计数器)开始并从内存中读取指令。您的代码解析此指令并使用此信息来更改处理器指定的处理器状态。解释的核心问题是它非常慢。每次处理给定指令时,都必须对其进行解码并执行必要的操作。

使用动态重新编译,您可以像解释一样对代码进行迭代,但不仅仅是执行操作码,您还可以构建一个操作列表。一旦到达分支指令,您就可以将此操作列表编译为主机平台的机器代码,然后缓存此编译代码并执行它。然后,当您再次点击给定指令组时,您只需执行缓存中的代码。(顺便说一句,大多数人实际上并没有列出指令列表,而是动态地将它们编译为机器代码——这使得优化变得更加困难,但这超出了这个答案的范围,除非有足够多的人感兴趣)

使用静态重新编译,您执行与动态重新编译相同的操作,但您遵循分支。您最终构建了代表程序中所有代码的代码块,然后可以在没有进一步干扰的情况下执行这些代码。如果没有以下问题,这将是一个很好的机制:

  • 开始时不在程序中的代码(例如压缩、加密、在运行时生成/修改等)将不会被重新编译,因此它不会运行
  • 已经证明找到给定二进制文件中的所有代码等价于停机问题

这些结合在一起,使得静态重新编译在 99% 的情况下完全不可行。有关更多信息,Michael Steil 对静态重新编译做了一些很棒的研究——这是我见过的最好的。

处理器仿真的另一面是您与硬件交互的方式。这真的有两个方面:

  • 处理器时序
  • 中断处理

处理器时序:

某些平台——尤其是像 NES、SNES 等较旧的控制台——要求你的模拟器有严格的时间来完全兼容。使用 NES,您拥有 PPU(像素处理单元),它要求 CPU 在精确的时刻将像素放入内存中。如果您使用解释,您可以轻松地计算周期并模拟正确的时间;使用动态/静态重新编译,事情变得/很多/更复杂。

中断处理:

中断是 CPU 与硬件通信的主要机制。通常,您的硬件组件会告诉 CPU 它关心什么中断。这非常简单——当您的代码引发给定中断时,您查看中断处理程序表并调用正确的回调。

硬件仿真:

模拟给定的硬件设备有两个方面:

  • 模拟设备的功能
  • 模拟实际的设备接口

以硬盘驱动器为例。通过创建后备存储、读/写/格式化例程等来模拟功能。这部分通常非常简单。

设备的实际接口要复杂一些。这通常是内存映射寄存器(例如,设备监视更改以执行信令的内存部分)和中断的某种组合。对于硬盘驱动器,您可能有一个内存映射区域,您可以在其中放置读取命令、写入等,然后将这些数据读回。

我会更详细地介绍,但是您可以使用一百万种方法。如果您在这里有任何具体问题,请随时提出,我会添加信息。

资源:

我想我在这里做了一个很好的介绍,但还有很多额外的领域。我很乐意为您解答任何问题;由于巨大的复杂性,我对其中的大部分内容都非常模糊。

强制性维基百科链接:

通用仿真资源:

  • Zophar—— 这是我开始仿真的地方,首先下载仿真器并最终掠夺他们庞大的文档档案。这是您可能拥有的绝对最佳资源。
  • NGEmu -- 没有多少直接资源,但他们的论坛是无与伦比的。
  • RomHacking.net - 文档部分包含有关流行控制台机器架构的资源

仿真器项目参考:

  • IronBabel——这是一个 .NET 的仿真平台,用 Nemerle 编写,可即时将代码重新编译为 C#。免责声明:这是我的项目,所以请原谅无耻的插件。
  • BSnes - 一个很棒的 SNES 模拟器,目标是循环完美的准确性。
  • MAME——街机模拟器。很好的参考。
  • 6502asm.com -- 这是一个 JavaScript 6502 模拟器,带有一个很酷的小论坛。
  • dynarec'd 6502asm -- 这是我在一两天内做的一个小技巧。我从 6502asm.com 获取了现有的模拟器并将其更改为将代码动态重新编译为 JavaScript 以大幅提高速度。

处理器重新编译参考:

附录:

自提交此答案以来已经有一年多的时间了,并且受到了所有关注,我认为是时候更新一些东西了。

也许现在仿真中最令人兴奋的事情是libcpu,由前面提到的 Michael Steil 启动。它是一个旨在支持大量 CPU 内核的库,这些内核使用 LLVM 进行重新编译(静态和动态!)。它有巨大的潜力,我认为它会为仿真做很多事情。

emu-docs也引起了我的注意,其中包含一个很棒的系统文档存储库,这对于仿真目的非常有用。我在那里的时间不多,但看起来他们有很多很棒的资源。

我很高兴这篇文章对我有所帮助,我希望我能在今年年底/明年年初之前完成我关于这个主题的书。

于 2009-01-15T22:13:48.723 回答
126

一个名叫 Victor Moya del Barrio 的人就这个主题写了他的论文。152 页上有很多很好的信息。您可以在此处下载 PDF 。

如果您不想注册scribd,您可以在 Google 上搜索 PDF 标题“仿真编程技术研究”。PDF有几个不同的来源。

于 2009-02-02T17:27:54.460 回答
43

模拟可能看起来令人生畏,但实际上比模拟要容易得多。

任何处理器通常都有一个写得很好的规范来描述状态、交互等。

如果您根本不关心性能,那么您可以使用非常优雅的面向对象程序轻松模拟大多数旧处理器。例如,X86 处理器需要一些东西来维护寄存器的状态(简单),一些东西来维护内存的状态(简单),以及接收每个传入命令并将其应用于机器的当前状态的东西。如果您真的想要准确性,您还可以模拟记忆翻译、缓存等,但这是可行的。

事实上,许多微芯片和 CPU 制造商都先针对芯片的仿真器测试程序,然后再针对芯片本身测试程序,这有助于他们找出芯片的规格是否存在问题,或者芯片在硬件中的实际实现是否存在问题。例如,编写一个会导致死锁的芯片规范是可能的,当硬件出现最后期限时,重要的是查看它是否可以在规范中重现,因为这表明存在比芯片实现中的问题更大的问题。

当然,视频游戏模拟器通常关心性能,因此它们不使用幼稚的实现,它们还包括与主机系统的操作系统接口的代码,例如使用绘图和声音。

考虑到旧视频游戏(NES/SNES 等)的性能非常缓慢,在现代系统上进行仿真非常容易。事实上,更令人惊奇的是,您可以下载一套有史以来的每款 SNES 游戏或任何一款 Atari 2600 游戏,考虑到当这些系统流行时,免费访问每个卡带将是梦想成真。

于 2009-01-15T22:43:44.043 回答
29

我知道这个问题有点老了,但我想在讨论中添加一些内容。这里的大多数答案都围绕着解释他们所模拟系统的机器指令的模拟器。

但是,有一个非常著名的例外,称为“UltraHLE”(维基百科文章)。UltraHLE 是有史以来最著名的模拟器之一,它模拟了商业 Nintendo 64 游戏(在家用计算机上具有不错的性能),当时人们普遍认为这是不可能的。事实上,当 UltraHLE 创建时,任天堂仍在为 Nintendo 64 制作新游戏!

我第一次在印刷杂志上看到关于模拟器的文章,以前我只在网上看到过它们的讨论。

UltraHLE 的概念是通过模拟 C 库调用而不是机器级调用来使不可能成为可能。

于 2010-07-07T18:17:46.453 回答
22

值得一看的是 Imran Nazar 尝试用 JavaScript 编写Gameboy模拟器。

于 2010-11-11T10:19:39.570 回答
18

在创建了我自己的 80 年代 BBC 微型计算机模拟器(在 Google 中输入 VBeeb)之后,有很多事情要知道。

  • 你不是在模仿真实的东西,那将是一个复制品。相反,您正在模拟State。一个很好的例子是计算器,实物有按钮、屏幕、外壳等。但是要模拟计算器,您只需要模拟按钮是向上还是向下、LCD 的哪些段打开等。基本上,一组数字表示在计算器中可以改变的事物的所有可能组合。
  • 您只需要模拟器的界面出现并表现得像真实的东西。越有说服力,仿真就越接近。幕后发生的事情可以是您喜欢的任何事情。但是,为了便于编写仿真器,在真实系统(即芯片、显示器、键盘、电路板和抽象计算机代码)之间存在心理映射。
  • 要模拟计算机系统,最简单的方法是将其分解成更小的块并单独模拟这些块。然后将整个批次串在一起以获得成品。就像一组带有输入和输出的黑匣子,非常适合面向对象编程。您可以进一步细分这些块以使生活更轻松。

实际上,您通常希望为仿真的速度和保真度而写作。这是因为目标系统上的软件将(可能)比源系统上的原始硬件运行得更慢。这可能会限制编程语言、编译器、目标系统等的选择。
除此之外,您还必须限制您准备模拟的内容,例如不需要模拟微处理器中晶体管的电压状态,但它可能是必要的模拟微处理器寄存器组的状态。
一般来说,仿真的细节级别越小,您对原始系统的保真度就越高。
最后,旧系统的信息可能不完整或不存在。因此,掌握原始设备是必不可少的,或者至少要分清另一个别人写的好模拟器!

于 2010-08-05T15:36:42.850 回答
17

是的,您必须“手动”解释整个二进制机器代码混乱。不仅如此,大多数时候您还必须模拟一些在目标机器上没有等效硬件的奇异硬件。

简单的方法是逐一解释指令。这很好用,但速度很慢。一种更快的方法是重新编译——将源机器代码翻译成目标机器代码。这更复杂,因为大多数指令不会一对一映射。相反,您将不得不做出涉及额外代码的复杂变通方法。但最终它要快得多。大多数现代模拟器都这样做。

于 2009-01-15T22:17:18.700 回答
15

当您开发仿真器时,您正在解释系统正在处理的处理器组件(Z80、8080、PS CPU 等)。

您还需要模拟系统具有的所有外围设备(视频输出、控制器)。

您应该开始为 simpe 系统编写模拟器,例如老式的Game Boy(使用 Z80 处理器,我没有弄错)或 C64。

于 2009-01-15T22:21:40.437 回答
10

模拟器很难创建,因为您需要模拟许多技巧(如不寻常的效果)、时间问题等。

有关这方面的示例,请参阅http://queue.acm.org/detail.cfm?id=1755886

这还将向您展示为什么您“需要”一个多 GHz CPU 来模拟 1MHz 的 CPU。

于 2010-05-16T16:51:43.763 回答
9

还可以查看 Darek Mihocka 的Emulators.com,了解有关 JIT 指令级优化的重要建议,以及构建高效仿真器的许多其他好东西。

于 2010-05-16T13:27:42.957 回答
7

我从来没有做过任何花哨的事情来模拟游戏机,但我确实参加过一次课程,任务是为 Andrew Tanenbaums Structured Computer Organization中描述的机器编写模拟器。这很有趣,给了我很多惊喜。在潜入编写真正的模拟器之前,您可能想拿起那本书。

于 2011-09-30T09:23:50.887 回答
4

关于模拟真实系统或您自己的东西的建议?我可以说模拟器通过模拟整个硬件来工作。也许不是电路(就像硬件一样移动位。移动字节是最终结果,所以复制字节就可以了)。模拟器很难创建,因为您需要模拟许多技巧(如不寻常的效果)、时间问题等。如果一个(输入)部分出错,则整个系统可能会出现故障,或者充其量会出现错误/故障。

于 2009-04-04T01:23:43.267 回答
4

共享源设备模拟器包含用于 PocketPC/Smartphone 模拟器的可构建源代码(需要 Visual Studio,在 Windows 上运行)。我在二进制版本的 V1 和 V2 上工作。

它解决了许多仿真问题: - 从客户虚拟到客户物理到主机虚拟的有效地址转换 - 客户代码的 JIT 编译 - 外围设备的模拟,例如网络适配器、触摸屏和音频 - 用于主机键盘和鼠标的 UI 集成 - 保存/状态恢复,用于模拟从低功耗模式恢复

于 2010-05-16T13:22:06.433 回答
1

添加@Cody Brocious 提供的答案
在虚拟化环境中,您正在向虚拟机模拟新系统(CPU、I/O 等),我们可以看到以下类别的模拟器。

解释:bochs 是解释器的一个例子,它是一个 x86 PC 仿真器,它将来自客户系统的每条指令翻译成另一组指令(主机 ISA)以产生预期的效果。是的,它很慢,它没有'不缓存任何东西,所以每条指令都经过相同的周期。

动态仿真器:Qemu 是一个动态仿真器。它对客户指令进行即时翻译也缓存结果。最好的部分是直接在主机系统上执行尽可能多的指令,以便仿真更快。正如 Cody 所提到的,它将代码分成块(1 个单一的执行流程)。

静态模拟器:据我所知,没有静态模拟器可以帮助虚拟化。

于 2012-06-28T06:55:36.133 回答
1

我将如何开始仿真。

1.获取基于低级编程的书籍,你需要它来为任天堂的“假装”操作系统......游戏男孩......

2.获取专门的仿真书籍,也许还有操作系统开发。(您不会制作操作系统,而是最接近它的操作系统。

3.查看一些开源模拟器,尤其是那些你想为之制作模拟器的系统。

4.将更复杂的代码片段复制到您的IDE/编译器中。这将节省您编写长代码的时间。这是我做os开发的,用的是linux的一个区

于 2013-02-01T21:31:08.167 回答
1

我写了一篇关于在 JavaScript 中模拟 Chip-8 系统的文章。

这是一个很好的起点,因为系统不是很复杂,但是您仍然可以了解操作码、堆栈、寄存器等如何工作。

我将很快为 NES 写一个更长的指南。

于 2013-06-05T04:13:07.623 回答