1

我有一个大的 c 代码文件(>9000 LoC)并尝试使用以下语法对其进行解析:

https://github.com/antlr/grammars-v4/blob/master/c/C.g4

我等了一个多小时才流产。该机器是具有 4GB 内存的 Core 2 Duo L9400。最大 java vm-heap-size 设置为 2GB。它不会产生任何解析错误,但它根本没有完成。

在做了一些研究之后,我将预测模式设置为 SLL,这会在几秒钟内产生“输入时没有可行的替代方案”。

接下来,我将预测模式设置为 LL_EXACT_AMBIG_DETECTION 并将 DiagnosticErrorListener 附加到解析器。这会产生很多“歧义报告”,主要涉及声明/声明说明符。我认为这会迫使解析器非常频繁地回溯,这可能是对长解析时间的解释?

除了尝试重写语法之外,我还能做些什么来提高性能?

任何帮助表示赞赏;)

4

2 回答 2

2

首先,重要的是要注意 ANTLR 4在解析期间从不回溯。

您所指的语法不是 SLL,它会阻止您以最快的模式使用 ANTLR 4。然而,在或实验期间,我们能够识别出我们更改为生成语法 SLL 的单个规则。您可以通过 antlr-interest 邮件列表获得更改后的语法。我现在正在参加音乐会,所以我无法访问它。

于 2013-10-12T00:38:47.047 回答
0

是的。我们将其从规范转换为仅更改一个规则即可证明您可以做到。我们会尽快优化那个。

于 2013-10-11T16:10:47.873 回答