我有一些 XML 文件,其中包含一个研究项目的数据,我需要对其进行一些统计。数据量接近100GB。
结构没有那么复杂(可以映射到关系模型中的大约 10 个表),并且考虑到问题的性质,这些数据将永远不会再次更新,我只需要它在易于运行查询的地方可用上。
我已经阅读过有关 XML 数据库以及在其上运行 XPATH 样式查询的可能性,但我从未使用过它们,而且我对它不太满意。将数据保存在关系数据库中将是我的首选。
因此,我正在寻找一种将存储在 XML 中的数据转换为关系数据库的方法(想想一个类似于 .sql 生成的大文件mysqldump
,但其他任何方法都可以)。最终目标是能够运行 SQL 查询来处理数据。
经过一些研究,我几乎确信我必须自己写它。但我觉得这是一个普遍的问题,因此应该有一个工具可以做到这一点。
那么,您知道任何可以将 XML 数据转换为关系数据库的工具吗?
PS1:
我的想法是这样的(它可以以不同的方式工作,但只是为了确保你明白我的意思):
- 分析数据结构(基于 XML 本身,或基于 XSD)
- 基于该结构构建关系数据库(表、键)
- 生成 SQL 语句以创建数据库
- 生成SQL语句创建填写数据
PS2:
我在这里看到了一些 帖子,但我仍然找不到解决方案。Microsoft 的“ Xml Bulk Load ”工具似乎朝着这个方向做了一些事情,但我没有 MS SQL Server。