0

我有 OFX 1.03 的 DTD(尽管已经开发并发布了 1.60,但他们的最新版本,但我离题了......)

我想使用正则表达式将实体、元素、其他标签拆分为其部分以进行进一步处理,这样我就可以使用这样的标签:

<!ENTITY % ACCTTOMACRO "(BANKACCTTO | CCACCTTO | INVACCTTO)">

并创建一个像这样的对象

新实体标签 { 字符串名称 = "%ACCTTOMACRO"; string[] ChildTypes = new string[] {"BANKACCTTO", "CCACCTTO", "INVACCTTO"}};

我有一个看起来像这样的正则表达式:

Regex re = new Regex(@"<!(\b)+([\s\S])?[^>]+>");  

诚然,我是正则表达式的新手,所以到目前为止我做得很好,这给了我一个匹配集合,而不是每个标签的 DTD,没有注释。

我想利用分组来促进前面提到的对象的创建。

如果我走错了路,请指导我,但是如果你下载这个文件,我想你可能会发现它不标准。(Visual Studio 对本文档的格式化方式提出了一些危险信号)

我不指望有人会惹上麻烦,但对于好奇的人来说,这里是下载规格的链接。

4

1 回答 1

2

看起来他们也有可用的模式。为什么不下载模式并使用 XML 解析器(例如 LINQ-to-XML)进行解析?

于 2009-10-16T18:07:23.590 回答