6

我试图在字符串中找到命名捕获组的开头以创建一个简单的解析器(请参阅相关问题)。为此,extract函数会记住last4变量中的最后一个字符。如果最后 4 个字符等于 "(?P<" 它是捕获组的开始:

package main

import "fmt"

const sample string = `/(?P<country>m((a|b).+)(x|y)n)/(?P<city>.+)`

func main() {
    extract(sample)
}

func extract(regex string) {
    last4 := new([4]int32)
    for _, c := range regex {
        last4[0], last4[1], last4[2], last4[3] = last4[1], last4[2], last4[3], c
        last4String := fmt.Sprintf("%c%c%c%c\n", last4[0], last4[1], last4[2], last4[3])
        if last4String == "(?P<" {
            fmt.Print("start of capturing group")
        }
    }
}

http://play.golang.org/p/pqA-wCuvux

但是这段代码什么也没打印!永远不会是真的,尽管如果我在循环内last4String == "(?P<"打印,这个子字符串会出现在输出中。last4String那么如何在 Go 中比较字符串呢?

还有比将 int32 数组转换为字符串更优雅的方法fmt.Sprintf("%c%c%c%c\n", last4[0], last4[1], last4[2], last4[3])吗?

还有什么可以更好的吗?我的代码对我来说有点不雅。

4

1 回答 1

3

如果它不是为了自学或类似的,你可能想使用标准库中现有的RE 解析器,然后“走”AST 来做任何需要的事情。

func Parse(s string, flags Flags) (*Regexp, error)

Parse 解析一个正则表达式字符串 s,由指定的 Flags 控制,并返回一个正则表达式解析树。语法在包 regexp 的顶级注释中描述。

您的任务甚至还有一个助手

EDIT1:您的代码已修复:

package main

import "fmt"

const sample string = `/(?P<country>m((a|b).+)(x|y)n)/(?P<city>.+)`

func main() {
        extract(sample)
}

func extract(regex string) {
        var last4 [4]int32
        for _, c := range regex {
                last4[0], last4[1], last4[2], last4[3] = last4[1], last4[2], last4[3], c
                last4String := fmt.Sprintf("%c%c%c%c", last4[0], last4[1], last4[2], last4[3])
                if last4String == "(?P<" {
                    fmt.Println("start of capturing group")
                }
        }
}

(也在这里

EDIT2:您的代码重写:

package main

import (
        "fmt"
        "strings"
)

const sample string = `/(?P<country>m((a|b).+)(x|y)n)/(?P<city>.+)`

func main() {
        extract(sample)
}

func extract(regex string) {
        start := 0
        for {
                i := strings.Index(regex[start:], "(?P<")
                if i < 0 {
                        break
                }

                fmt.Printf("start of capturing group @ %d\n", start+i)
                start += i + 1
        }
}

(也在这里

于 2012-11-11T21:32:16.787 回答