我有一堆从元数据中可以看出应该是 PDF 的文件。其中一些确实是完整的 PDF。其中一些似乎是 PDF 文件的第一部分,尽管它们缺少 the%%EOF
和其他页脚值。
其他似乎是 PDF 文件的最后一部分(它们没有任何 PDF 的标题,但它们确实有这些%%EOF
东西)。奇怪的是,它们从以下 16 字节的魔术头开始:
0x50, 0x4B, 0x57, 0x41, 0x52, 0x45, 0x00, 0x00, 0x00, 0x00, 0x00, 0x57, 0x49, 0x4E, 0x33, 0x32
( PKWARE WIN32
)。
我做了很多可能会产生误导的推论,但它似乎不是一种压缩方案(这些%%EOF
东西是纯文本的),并且在我被允许深入研究的几个文件中,开始之间存在相关性有了这种魔力,看起来就像 PDF 二进制文件的最后一段。
有人对这里可能使用的文件格式有任何提示吗?
更新:我现在观察到PKWARE WIN32
非 PDF 文件也会发生这种情况。推测还表明这些文件以类似的方式拆分。
更新 2:事实证明,此PKWARE WIN32
标头实际上以重复的间隔出现,其位置可以通过紧接在标头之前的一些字节来预测。
我还收到了一些间接的传闻,这些传闻表明这些文件被压缩并且没有分成多个部分,尽管在 3 个案例中有 2 个告诉我输出文件大小我的二进制文件只小到可以忽略不计。
谜团还在继续。