-1

每天,我们需要将大约 60,000 个 xml 文件解析为 PostgreSQL 或 mysql 数据库中的 3 个表。每个文件的大小约为 50-300k。有 10 种类型的消息。每个文件都有不同类型的消息。使用什么方法或工具使解析变得健壮、高效?

4

2 回答 2

1

有很多方法可以解决这个问题。解析 XML 并不是一个独特的问题——几乎任何体面的语言都可以做到这一点。

你在哪个平台?

你最熟悉什么语言?

健壮性而言,Python 是一种出色的语言,具有良好的错误处理能力、非常灵活、开发速度快、易于维护。

如果您选择 python,您将需要使用基于 c 的 xml 扩展来提高速度。看看http://lxml.de/,或者 ElementTree 在某些版本中由 ac 模块支持。

更多细节将提示更好的答案。

于 2012-11-02T23:12:25.023 回答
1

我会使用 Perl、Mojo::DOMDBIx::Connector和 PostgreSQL。

于 2012-11-02T22:48:59.990 回答