好的,所以这是一个独特的问题。
我们(每天)从一家公司获取文件。这些文件从他们的服务器下载到我们的 (SFTP)。我们处理的公司与创建文件(并减小文件大小)的第三方提供商打交道,以加快下载速度并减少服务器上的文件大小。
我们每天从服务器下载 9 个文件,3 组,每组 3 个文件,
每组文件由 2 个 XML 文件和一个“图像”文件组成。
这些 XML 文件之一为我们提供了有关“图像”文件的信息。我们需要的 XML 文件中的信息:
- 偏移量:告诉我们一段数据从哪里开始
- 长度:与偏移量一起使用,给我们该部分的结尾
- count:给我们文件中保存的元素数量
在我们根据文件中每个图像的偏移量和长度将文件分割成片段之前 ,“图像”文件本身是不可用的。这些图像基本上是串联在一起的。我们需要提取这些图像才能查看它们。
偏移量、长度和计数值的示例如下:
偏移量:0
长度:2670
偏移量:2670
长度:2670
偏移量:5340
长度:2670
偏移量:8010
长度:2670
计数:4
这意味着有 4 ( count
) 个项目。第一个计数项目开始于offset[0]
并且是length[0]
长度。第二项开始于offset[1]
长度length[1]
,等等。
我需要在这些点和这些点精确地分割图像,没有错误的余地。第三方提供商不会向我们提供代码,我们将自己解决这个问题。如果不拆分文件,图像文件是不可读的,并且在此之前基本上是无用的。
我的问题:有没有人有办法以特定字节拆分文件?
PS我还没有任何代码。我什至不知道从哪里开始。我对编码并不陌生,但我从未按字节进行文件拆分。
我不在乎它使用哪种语言。我只需要让它工作。
编辑
操作系统是 Windows