0

我需要解析一些已知的文件格式,其中之一是CUSCAR格式,我坚信 RegEx 会完成这项工作,有什么建议吗?

4

1 回答 1

2

我刚刚查看了 CUSCAR 规范,我想你会得到一些非常丑陋的正则表达式代码来解析它。如果你只解析它的一部分,你可以侥幸逃脱。您必须测试速度,因为您的主要瓶颈是 I/O。

我对来自 QWEST 的供应商文件做了类似的事情。这些野兽是分层的文本文件。解析那些糟透的!我目前正在(每天)创建和解析 4 到 5000 万行的文本文件。

有一个很好的框架叫做FileHelpers Library。该框架将帮助您创建面向对象的记录表示(文本行)。它甚至有一个很好的向导来引导您创建这些代表记录的对象。它将轻松处理主细节、分隔和固定格式。

于 2008-11-08T00:34:18.500 回答