7

在浏览了关于好的 C# 解析器生成器的帖子后,我偶然发现了 GPLEX 和 GPPG。我想使用 GPLEX 生成令牌,以便 GPPG 解析和创建树(类似于 lex/yacc 关系)。但是,我似乎找不到关于这两者如何相互作用的例子。使用 lex/yacc,lex 返回由 yacc 定义的标记,并且可以将值存储在 yylval 中。这是如何在 GPLEX/GPPG 中完成的(他们的文档中缺少它)?

附件是我想转换为 GPLEX 的 lex 代码:

%{
 #include <stdio.h>
 #include "y.tab.h"
%}
%%
[Oo][Rr]                return OR;
[Aa][Nn][Dd]            return AND;
[Nn][Oo][Tt]            return NOT;
[A-Za-z][A-Za-z0-9_]*   yylval=yytext; return ID;
%%

谢谢!安德鲁

4

5 回答 5

4

首先:在您的项目中包含参考“QUT.ShiftReduceParser.dll”。它在 GPLEX 的下载包中提供。

主程序的示例代码:

using System;
using ....;
using QUT.Gppg;
using Scanner;
using Parser;

namespace NCParser
{
class Program
{
    static void Main(string[] args)
    {
        string pathTXT = @"C:\temp\testFile.txt";
        FileStream file = new FileStream(pathTXT, FileMode.Open);
        Scanner scanner = new Scanner();
        scanner.SetSource(file, 0);
        Parser parser = new Parser(scanner);            
    }
}
}    

GPLEX 的示例代码:

%using Parser;           //include the namespace of the generated Parser-class
%Namespace Scanner       //names the Namespace of the generated Scanner-class
%visibility public       //visibility of the types "Tokens","ScanBase","Scanner"
%scannertype Scanner     //names the Scannerclass to "Scanner"
%scanbasetype ScanBase   //names the Scanbaseclass to "ScanBase"
%tokentype Tokens        //names the Tokenenumeration to "Tokens"

%option codePage:65001 out:Scanner.cs /*see the documentation of GPLEX for further Options you can use */

%{ //user-specified code will be copied in the Output-file
%}

OR [Oo][Rr]
AND [Aa][Nn][Dd]
Identifier [A-Za-z][A-Za-z0-9_]*

%% //Rules Section
%{ //user-code that will be executed before getting the next token
%}

{OR}           {return (int)Tokens.kwAND;}
{AND}          {return (int)Tokens.kwAND;}
{Identifier}   {yylval = yytext; return (int)Tokens.ID;}

%% //User-code Section

GPPG 输入文件的示例代码:

%using Scanner      //include the Namespace of the scanner-class
%output=Parser.cs   //names the output-file
%namespace Parser  //names the namespace of the Parser-class

%parsertype Parser      //names the Parserclass to "Parser"
%scanbasetype ScanBase  //names the ScanBaseclass to "ScanBase"
%tokentype Tokens       //names the Tokensenumeration to "Tokens"

%token kwAND "AND", kwOR "OR" //the received Tokens from GPLEX
%token ID

%% //Grammar Rules Section

program  : /* nothing */
         | Statements
         ;

Statements : EXPR "AND" EXPR
           | EXPR "OR" EXPR
           ;

EXPR : ID
     ;

%% User-code Section
// Don't forget to declare the Parser-Constructor
public Parser(Scanner scnr) : base(scnr) { }

于 2015-09-21T11:38:37.627 回答
2

我有一个类似的问题 - 由于明显缺乏文档,我不知道如何将我的 GPLEX 输出与 GPPG 一起使用。我认为问题源于 GPLEX 发行版包括 gppg.exe 和 gplex.exe,但只有 GPLEX 的文档。

如果您访问 GPPG 主页并下载该发行版,您将获得 GPPG 的文档,其中描述了输入文件的要求、如何构建语法等。哦,您还将再次获得这两个二进制文件 - gppg .exe 和 gplex.exe。

似乎将所有内容都包含在一个包中会更简单。它肯定可以消除一些困惑,特别是对于那些可能对词法分析(标记化)和解析(并且可能还不是 100% 熟悉两者之间的差异)不熟悉的人来说。

所以无论如何,对于那些可能第一次这样做的人:

GPLEX http://gplex.codeplex.com - 用于标记化/扫描/词法分析(同样的事情)

GPPG http://gppg.codeplex.com/ - 将分词器的输出作为输入进行解析。例如,解析器使用语法并且可以做一些简单的分词器不能做的事情,比如检测括号集是否匹配。

于 2013-10-31T23:54:37.307 回答
1

前段时间,我同样需要同时使用 GPLEX 和 GPPG,为了让工作更轻松,我创建了一个 nuget 包,用于在 Visual Studio 中同时使用 GPPG 和 GPLEX。
该包可以安装在基于 .Net Framework 的 C# 项目中,并在 Visual Studio 的包管理器控制台中添加一些命令。此命令可帮助您配置 C# 项目以在构建过程中集成 GPPG 和 GPLEX。本质上,在您的项目中,您将编辑 YACC 和 LEX 文件作为源代码,并且在项目构建期间,将生成解析器和扫描器。此外,command-let 将自定义解析器和扫描器所需的文件添加到项目中。

你可以在这里找到它: https ://www.nuget.org/packages/YaccLexTools/

这是一个博客文章的链接,解释了如何使用它: http ://ecianciotta-en.abriom.com/2013/08/yacclex-tools-v02.html

于 2019-06-11T17:11:15.677 回答
0

您是否考虑过使用Roslyn?(这不是一个正确的答案,但我没有足够的声誉来发表评论)

于 2012-11-05T15:07:24.080 回答
0

具有讽刺意味的是,当我开始使用 C# 解析器时,我正是从这两个工具开始的(大约一年前)。然后词法分析器有小错误(易于修复):

但解析器更严重:

Lexer 应该已修复(发布日期为 2013 年 6 月),但解析器可能仍然存在此错误(2012 年 5 月)。

所以我编写了自己的套件 :-) https://sourceforge.net/projects/naivelangtools/并从那时起使用和开发它。

您的示例(在 NLT 中)翻译为:

/[Oo][Rr]/                -> OR;
/[Aa][Nn][Dd]/            -> AND;
/[Nn][Oo][Tt]/            -> NOT;
// by default text is returned as value
/[A-Za-z][A-Za-z0-9_]*/   -> ID;

整个套件类似于 lex/yacc,尽可能不依赖副作用(因此您返回适当的值)。

于 2013-11-01T08:53:27.657 回答