4

假设我只需要标记和解析多行注释,我将如何使用 Parse::Lex 来做到这一点。使用 flex-bison 时,lex 文件的规则部分中的任何模式的默认操作曾经是“跳过”。

%%
.*    ;
%%

如何在这里做到这一点?

[编辑]好吧,我试过了,我仍然缺少一些东西 - 这是我的代码 - 和结果。我哪里出错了??

我的简化 lex 文件:

use Parse::Lex;
use Regexp::Common;
use YParser;
my $lexer;
my @token = (
qw|esp:TA abcdefgh|,
qw(esp:REST .|\n),
);
Parse::Lex->trace;
Parse::Lex->exclusive('esp');
$lexer = Parse::Lex->new(@token);
$lexer->from(\*STDIN);
$lexer->skip(qr! [ \t]+ | $RE{balanced}{-begin=>'/*'}{-end=>'*/'} !xms);
$lexer->start('esp');

my $j = YParser->new();
$j->YYParse(yylex => \&lex);

sub lex {
    my $token = $lexer->next;
    return ('', undef) if $lexer->eoi;
    if ($token->name eq 'TA' || $token->name eq 'REST') {
        return ($token->name, {LINENO => $lexer->line, TEXT => $token->text});
    }
}

我的简化语法文件

% token TA REST

%%

Program:  Element
          | Program Element
;
Element:  TA
          | REST
;

%%

输入文件:

abcdefgh
/*sdf*/

结果:perl lexfile.pl < inputfile

Trace is ON in class Parse::Lex
Can't call method "name" on an undefined value at qnlex.pl line 26, <STDIN> line 1.
4

2 回答 2

1

好吧,我想通了 :) 非常简单——我所要做的就是让 lex 在遇到我想跳过的标记时获得下一个标记。下面是跳过将令牌“REST”传递给解析器的代码。

sub lex {
    my $token;
    NEXTTOKEN:
    $token = $lexer->next;
    return ('', undef) if $lexer->eoi;
    if ($token->name eq 'TA') {
        return ($token->name, {LINENO => $lexer->line, TEXT => $token->text});
    }
    elsif ($token->name eq 'REST') {
        goto NEXTTOKEN;
    }
}
于 2012-10-09T19:28:04.623 回答
1

使用skip此处显示的设置,使用Regexp::Common来帮助构建匹配平衡的注释分隔符对的正则表达式。我假设/* */为注释分隔符,但它们可以是任何东西。

$lexer->skip(qr! [ \t]+ | $RE{balanced}{-begin=>'/*'}{-end=>'*/'} !xms);

[ \t]+替代方案保留在原地,因为这是默认设置。

于 2012-08-15T17:58:17.140 回答