c# - 使用 Irony 解析时包含空格

Question

我正在使用以下库编写解析器： https ://www.nuget.org/packages/Irony

我目前的目标是解析一个包含纯文本行的文件。每行都以空格或制表符开头。

这是我的语法课的样子：

NonTerminal program = new NonTerminal("program");
NonTerminal textStatement = new NonTerminal("textStatement");
NonTerminal textStatements = new NonTerminal("textStatements");

FreeTextLiteral text = new FreeTextLiteral("text", "\r\n");

KeyTerm whitespace = ToTerm(" ", "whitespace");
KeyTerm tab = ToTerm("  ", "tab");
KeyTerm newline = ToTerm("\n", "newline");

textStatement.Rule = ((whitespace | tab) + text + newline);
textStatements.Rule = MakePlusRule(textStatements, textStatement);

program.Rule = textStatements;
this.Root = program;

这是目标文件的内容（不包括行）：

----------------------
 test

----------------------

令人惊讶的是，这件事在我身上失败了，并显示以下消息：

Column 1, Line 0:
Syntax error, expected: whitespace, tab

看起来语法默认配置为跳过空格和制表符。因此，它从一个“t”字母开始解析，跳过了第一个“”符号。这对大多数情况都很好，但不适用于这种情况。我正在尝试编写类似 python 的语言，因此跟踪空格很重要。

我不希望您为我编写整个语法，只是建议一种通用方法。任何帮助表示赞赏，谢谢！

UPD：我最终覆盖了 2 个这样的函数：

    public override bool IsWhitespaceOrDelimiter(char ch)
    {
        if (ch == ' ' || ch == '\t')
            return false;
        return base.IsWhitespaceOrDelimiter(ch);
    }

    public override void SkipWhitespace(ISourceStream source)
    {
        while (!source.EOF())
        {
            switch (source.PreviewChar)
            {
                //case ' ':
                //case '\t':
                //    break;
                case '\r':
                case '\n':
                case '\v':
                    if (UsesNewLine) return;
                    break;
                default:
                    return;
            }
            source.PreviewPosition++;
        }
    }

score 2 · Accepted Answer

如果要在语法中将“空格”作为显式字符处理，则需要重写 IsWhitespaceOrDelimiter 方法，并且空格返回 false。与制表符和其他字符相同

c# - 使用 Irony 解析时包含空格

1 回答 1

Related

Reference