我有一个要加载到 mysql 中的大型 xml 文件。它大约有 20 GB 未压缩,但我认为我可以将其压缩到其原始大小的 25% 左右,然后将其批量上传到压缩表中。
我知道我可以压缩数据库本身的数据,但它可以在批量添加过程中读取压缩文件吗?
编辑:通过压缩我并不意味着它是一个 .gz.tar 文件或任何东西。我的意思是当我在 Java 或 C++ 中创建文件时,我将它作为 gzip 输出,因此文件本身是 .csv 或 .xml 并保留正确的结构,但其中的项目(每一行)被压缩。
如果这是不可能的,我可以做一些像批量上传但以某种方式通过解压缩内容的程序过滤它吗?我正在考虑在 C 中打开文件并在将其加载到 mysql 时对其进行压缩。问题是我想在批量插入中执行此操作,而不是数百万个单独的插入。