0

使用 encoding/xml.Decoder 我试图手动解析从http://www.khronos.org/files/collada_schema_1_4加载的 XML 文件

出于测试目的,我只是对文档进行迭代,打印出遇到的任何令牌类型:

func Test (r io.Reader) {
    var t xml.Token
    var pa *xml.Attr
    var a xml.Attr
    var co xml.Comment
    var cd xml.CharData
    var se xml.StartElement
    var pi xml.ProcInst
    var ee xml.EndElement
    var is bool
    var xd = xml.NewDecoder(r)
    for i := 0; i < 24; i++ {
        if t, err = xd.Token(); (err == nil) && (t != nil) {
            if a, is = t.(xml.Attr); is { print("ATTR\t"); println(a.Name.Local) }
            if pa, is = t.(*xml.Attr); is { print("*ATTR\t"); println(pa) }
            if co, is = t.(xml.Comment); is { print("COMNT\t"); println(co) }
            if cd, is = t.(xml.CharData); is { print("CDATA\t"); println(cd) }
            if pi, is = t.(xml.ProcInst); is { print("PROCI\t"); println(pi.Target) }
            if se, is = t.(xml.StartElement); is { print("START\t"); println(se.Name.Local) }
            if ee, is = t.(xml.EndElement); is { print("END\t\t"); println(ee.Name.Local) }
        }
    }
}

现在这里是输出:

PROCI   xml
CDATA   [1/64]0xf84004e050
START   schema
CDATA   [2/129]0xf84004d090
COMNT   [29/129]0xf84004d090
CDATA   [2/129]0xf84004d090
START   annotation
CDATA   [3/129]0xf84004d090
START   documentation
CDATA   [641/1039]0xf840061000
END     documentation
CDATA   [2/1039]0xf840061000
END     annotation
CDATA   [2/1039]0xf840061000
COMNT   [37/1039]0xf840061000
CDATA   [2/1039]0xf840061000
START   import
END     import
CDATA   [2/1039]0xf840061000
COMNT   [14/1039]0xf840061000
CDATA   [2/1039]0xf840061000
START   element
CDATA   [3/1039]0xf840061000
START   annotation

请注意,即使到最后(第 24 行)根xs:schema元素以及xs:importxs:element元素中都传递了许多属性,但没有输出 ATTR 或 *ATTR 行。

这是在 Windows 7 64 位下的 Go 1.0.3 64 位。我做错了什么还是应该提交 Go 包错误报告?

[旁注:当将普通的xml.Unmarshal转换为正确准备的结构时,已知命名和映射的属性被 xml 包捕获并映射就好了。但我还需要在根元素中收集“未知”属性(为这个用例收集命名空间信息,用例是http://github.com/metaleap/go-xsd),因此我尝试使用解码器.Token()]

4

1 回答 1

5

是的,这种行为是意料之中的。属性被解析,但不作为 xml.Token 返回。属性根本不是令牌。见: http: //golang.org/pkg/encoding/xml/#Token

可以通过 Token StartElement 中的 Attr 字段访问这些属性。请参阅: http: //golang.org/pkg/encoding/xml/#StartElement

((一些一般提示:

a) 不要使用 print 或 println。

b) a, ok := t.(SomeType) 成语被称为“comma OK”,因为布尔值通常被命名为“ok”,而不是“is”。请遵守这些约定。

c)惯用语会像

switch t := t.(type) {
  case xml.StartElement: ...
  case xml.EndElement: ...
}

而不是您的“if a, is = t.(xml.Attr) ...”列表

d)所有这些“var se xml.StartElement”都是噪音(混乱)。采用

if se, ok := t.(xml.StartElement); ok { ... }

这将使您的代码更具可读性。))

于 2012-11-07T09:51:25.037 回答