21

我正在为 Pascal 的一个子集编写一个编译器。编译器为制造的机器生成机器指令。我想为这种机器语言编写一个窥孔优化器,但我在替换一些更复杂的模式时遇到了麻烦。

窥孔优化器规格

我研究了几种不同的方法来编写窥视孔优化器,并确定了一种后端方法:

  • emit()每次生成机器指令时,编码器都会调用函数。
  • emit(Instruction currentInstr)检查窥视孔优化表:
    • 如果当前指令匹配模式的尾部:
      1. 检查先前发出的匹配说明
      2. 如果所有指令都与模式匹配,则应用优化,修改代码存储的尾部
    • 如果没有找到优化,照常发出指令

当前的设计方法

该方法很简单,这是我遇到问题的实现。在我的编译器中,机器指令存储在一个Instruction类中。我写了一个InstructionMatch类存储正则表达式,用于匹配机器指令的每个组件。如果模式匹配某些机器指令,它的equals(Instruction instr)方法就会返回。trueinstr

但是,我无法完全应用我拥有的规则。首先,我觉得鉴于我目前的方法,我最终会得到一堆不必要的东西。鉴于窥视孔优化数字的完整列表可以包含大约 400 个模式,这将很快失控。此外,我实际上无法使用这种方法获得更困难的替换(请参阅“我的问题”)。

替代方法

我读过的一篇论文将以前的指令折叠成一个长字符串,使用正则表达式进行匹配和替换,并将字符串转换回机器指令。这对我来说似乎是一个不好的方法,如果我错了,请纠正我。

示例模式,模式语法

x: JUMP x+1; x+1: JUMP y  -->  x: JUMP y
LOADL x; LOADL y; add     -->  LOADL x+y
LOADA d[r]; STOREI (n)    -->  STORE (n) d[r]

请注意,这些示例模式中的每一个都只是以下机器指令模板的人类可读表示:

op_code register n d

(n 通常表示字数,d 表示地址位移)。语法x: <instr>指示指令存储在x代码存储中的地址处。

因此,当操作码为 5时,该指令LOADL 17相当于完整的机器指令(并且在该指令中未使用)5 0 0 17LOADLnr

我的问题

因此,鉴于这种背景,我的问题是:当我需要在替换中包含先前指令的部分作为变量时,如何有效地匹配和替换模式?例如,我可以简单地用LOADL 1; add增量机器指令替换所有实例——我不需要前面指令的任何部分来执行此操作。但是我不知道如何在替换模式中有效地使用我的第二个示例的“x”和“y”值。

编辑:我应该提到一个Instruction类的每个字段只是一个整数(对于机器指令来说是正常的)。模式表中任何使用 'x' 或 'y' 的变量都是代表任何整数值的变量。

4

1 回答 1

17

一个简单的方法是将窥视孔优化器实现为有限状态机。

我们假设您有一个生成指令但不发出指令的原始代码生成器,以及一个将实际代码发送到对象流的发出例程。

状态机捕获您的代码生成器生成的指令,并通过在状态之间转换来记住 0 个或多个生成的指令序列。因此,一个状态隐含地记住了一个(短)生成但未发出的指令序列;它还必须记住它捕获的指令的关键参数,例如寄存器名称、常量值和/或寻址模式和抽象目标内存位置。一个特殊的开始状态会记住空的指令串。在任何时候,您都需要能够发出未发出的指令(“flush”);如果你一直这样做,你的窥视孔生成器会捕获下一条指令,然后发出它,不会做任何有用的工作。

为了做有用的工作,我们希望机器捕获尽可能长的序列。由于机器指令通常有很多种,实际上您不能连续记住太多,否则状态机将变得庞大。但是对于最常见的机器指令(加载、添加、cmp、分支、存储),记住最后两个或三个是很实用的。机器的大小实际上将由我们关心的最长窥视孔优化的长度决定,但如果该长度为 P,则整个机器不需要 P 个状态深度。

每个状态都根据我由您的代码生成器生成的“下一个”指令转换到下一个状态。想象一个状态代表 N 条指令的捕获。过渡选择是:

  • 刷新此状态表示的最左边的 0 条或更多(称为此 k)指令,并转换到下一个状态,表示 N-k+1,表示额外捕获机器指令 I 的指令。
  • 刷新此状态表示的最左边的 k 条指令,转换到表示剩余 Nk 条指令的状态,并重新处理指令 I。
  • 完全刷新状态,并发出指令 I。[您实际上可以在刚开始的状态下执行此操作]。

在刷新 k 指令时,实际发出的是那些 k 的窥视孔优化版本。您可以在发出此类指令时计算任何您想要的东西。您还需要适当地记住“移位”剩余指令的参数。

这一切都可以通过窥视孔优化器状态变量以及代码生成器生成下一条指令的每个点的 case 语句轻松实现。case 语句更新窥视孔优化器状态并实现转换操作。

假设我们的机器是一个增强堆栈机器,有

 PUSHVAR x
 PUSHK i
 ADD
 POPVAR x
 MOVE x,k

指令,但原始代码生成器仅生成纯堆栈机器指令,例如,它根本不发出 MOV 指令。我们希望窥视孔优化器能够做到这一点。

我们关心的窥视孔案例有:

 PUSHK i, PUSHK j, ADD ==> PUSHK i+j
 PUSHK i, POPVAR x ==> MOVE x,i 

我们的状态变量是:

 PEEPHOLESTATE (an enum symbol, initialized to EMPTY)
 FIRSTCONSTANT (an int)
 SECONDCONSTANT (an int)

我们的案例陈述:

GeneratePUSHK:
    switch (PEEPHOLESTATE) {
        EMPTY: PEEPHOLESTATE=PUSHK;
               FIRSTCONSTANT=K;
               break;
        PUSHK: PEEPHOLESTATE=PUSHKPUSHK;
               SECONDCONSTANT=K;
               break;
        PUSHKPUSHK:
        #IF consumeEmitLoadK // flush state, transition and consume generated instruction
               emit(PUSHK,FIRSTCONSTANT);
               FIRSTCONSTANT=SECONDCONSTANT;
               SECONDCONSTANT=K;
               PEEPHOLESTATE=PUSHKPUSHK;
               break;
        #ELSE // flush state, transition, and reprocess generated instruction
               emit(PUSHK,FIRSTCONSTANT);
               FIRSTCONSTANT=SECONDCONSTANT;
               PEEPHOLESTATE=PUSHK;
               goto GeneratePUSHK;  // Java can't do this, but other langauges can.
        #ENDIF
     }

  GenerateADD:
    switch (PEEPHOLESTATE) {
        EMPTY: emit(ADD);
               break;
        PUSHK: emit(PUSHK,FIRSTCONSTANT);
               emit(ADD);
               PEEPHOLESTATE=EMPTY;
               break;
        PUSHKPUSHK:
               PEEPHOLESTATE=PUSHK;
               FIRSTCONSTANT+=SECONDCONSTANT;
               break:
     }  

  GeneratePOPX:
    switch (PEEPHOLESTATE) {
        EMPTY: emit(POP,X);
               break;
        PUSHK: emit(MOV,X,FIRSTCONSTANT);
               PEEPHOLESTATE=EMPTY;
               break;
        PUSHKPUSHK:
               emit(MOV,X,SECONDCONSTANT);
               PEEPHOLESTATE=PUSHK;
               break:
     }

GeneratePUSHVARX:
    switch (PEEPHOLESTATE) {
        EMPTY: emit(PUSHVAR,X);
               break;
        PUSHK: emit(PUSHK,FIRSTCONSTANT);
               PEEPHOLESTATE=EMPTY;
               goto GeneratePUSHVARX;
        PUSHKPUSHK:
               PEEPHOLESTATE=PUSHK;
               emit(PUSHK,FIRSTCONSTANT);
               FIRSTCONSTANT=SECONDCONSTANT;
               goto GeneratePUSHVARX;
     }

#IF 显示了两种不同风格的转换,一种使用生成的指令,另一种不使用;要么适用于这个例子。当你最终得到几百个这样的 case 语句时,你会发现这两种类型都很方便,“不使用”版本可以帮助你保持代码更小。

我们需要一个例程来刷新窥视孔优化器:

  flush() {
    switch (PEEPHOLESTATE) {
        EMPTY: break;
        PUSHK: emit(PUSHK,FIRSTCONSTANT);
               break;
        PUSHKPUSHK:
               emit(PUSHK,FIRSTCONSTANT),
               emit(PUSHK,SECONDCONSTANT),
               break:
      }
      PEEPHOLESTATE=EMPTY;
      return; }

有趣的是考虑这个窥视孔优化器对以下生成的代码做了什么:

      PUSHK  1
      PUSHK  2
      ADD
      PUSHK  5
      POPVAR X
      POPVAR Y

整个 FSA 方案所做的是隐藏您在状态转换中的模式匹配,以及在案例中对匹配模式的响应。您可以手动编写代码,而且代码和调试速度快且相对容易。但是当案例数量变大时,您不想手动构建这样的状态机。你可以编写一个工具来为你生成这个状态机;很好的背景是 FLEX 或 LALR 解析器状态机生成。我不会在这里解释这个:-}

于 2012-05-11T03:17:06.307 回答