3

我有以下非常简单的(测试)语法文件

@start = expression+;
expression = keyword | otherWord;
otherWord = Word;
keyword = a | the;
a = 'a';
the = 'the';

然后我运行以下代码:

// Grammar contains the contents of the above grammar file.
PKParser *parser = [[PKParserFactory factory] parserFromGrammar:grammar assembler:self];
NSString *s = @"The parrot";
[parser parse:s];
PKReleaseSubparserTree(parser);

以及以下方法:

- (void)didMatchA:(PKAssembly *)a{
    [self log:a type:@"didMatchA          "];
}
- (void)didMatchThe:(PKAssembly *)a{
    [self log:a type:@"didMatchThe        "];
}
- (void)didMatchKeyword:(PKAssembly *)a{
    [self log:a type:@"didMatchKeyword    "];
}
- (void)didMatchExpression:(PKAssembly *)a{
    [self log:a type:@"didMatchExpression "];
}
- (void)didMatchOtherWord:(PKAssembly *)a{
    [self log:a type:@"didMatchOtherWord  "];
}

-(void) log:(PKAssembly *) assembly type:(NSString *) type{
    PKToken * token = [assembly top];
    NSLog(@"Method: [%@], token: %@, assembly: %@", type, token, assembly);
}

最后我在日志中收到这些消息:

[1] Method: [didMatchThe        ], token: The, assembly: [The]The^parrot
[2] Method: [didMatchKeyword    ], token: The, assembly: [The]The^parrot
[3] Method: [didMatchOtherWord  ], token: The, assembly: [The]The^parrot
[4] Method: [didMatchExpression ], token: The, assembly: [The]The^parrot
[5] Method: [didMatchExpression ], token: The, assembly: [The]The^parrot
[6] Method: [didMatchOtherWord  ], token: parrot, assembly: [The, parrot]The/parrot^
[7] Method: [didMatchExpression ], token: parrot, assembly: [The, parrot]The/parrot^

这是有道理的,但我不明白为什么会出现 %5 。我真的很希望能够删除双重匹配,以便诸如“The”之类的关键字仅触发didMatchThe而不触发didMatchKeyword

不幸的是, parsekit 上的 doco 似乎不存在其语法语法以及它如何决定触发方法。是的,我也查看了源代码 :-)

有没有人有使用 parsekit 的经验并且可以对此有所了解?

4

1 回答 1

2

我是 ParseKit 的开发人员,这实际上是正确的行为。这里有一些项目可以帮助解决这个问题:

  1. 了解 ParseKit 如何工作的最佳方式是购买Steven John Metsker 的“Building Parsers with Java”。ParseKit 几乎完全基于那里的设计。

  2. ParseKit 的解析器组件非常动态并且具有无限前瞻功能。这使得它非常适合快速开发或轻松解析小输入,但这也意味着 ParseKit 在解析大型文档时表现出极差的性能。

  3. 由于 ParseKit 的无限前瞻,您实现的汇编程序方法将被多次调用。实际上,正如您在上面描述的那样,它们会被调用太多次。这很正常。ParseKit 在任何时候都在探索所有可能的解析路径,所以你会得到“太多”的回调。

  4. 答案是永远不要在汇编回调方法中处理 ivars。在您的 Assembler 方法中,您应该始终在当前PKAssemblytargetivar 中保留您正在处理的状态。

    目标

当前PKAssembly是传递给您的回调方法的那个。

希望有帮助。

于 2011-06-04T16:00:07.053 回答