8

我目前正在开发一个上传一组文件的工具,然后使用 md5 校验和将文件与上传的最后一批文件进行比较,并告诉您哪些文件已更改。

对于常规文件,这工作正常,但一些上传的文件是 zip 档案,几乎总是发生变化,即使其中的文件是相同的。

有没有办法执行不同类型的校验和来检查这些文件是否已更改,而无需单独解压缩每个文件,然后单独比较每个文件的内容。

这是我当前的功能

function check_if_changed($date, $folder, $filename)
{
  $dh = opendir('./wp-content/uploads/Base/');
  while (($file = readdir($dh)) !== false) {
    $folders[] = $file;
  }
  sort($folders);
  $position = array_search($date, $folders);
  $prev_folder = $folders[$position - 1];
  if ($prev_folder == '.' || $prev_folder == '..')
    { return true;}
  $newhash = md5_file('./wp-content/uploads/Base/'.$date.'/'.$folder.'/'.$filename);
  $oldhash = md5_file('./wp-content/uploads/Base/'.$prev_folder.'/'.$folder.'/'.$filename);
  if ($oldhash != $newhash){
    return true;
  }
  return false;
}
4

2 回答 2

8

在 zip 存档中,每个“文件”都存储有元数据,如上次修改时间、文件名、文件大小(以字节为单位)等......以及重要的部分 - crc32 校验和

基本上,您可以以二进制方式对 zip 存档进行操作,找到每个文件的元数据头并将校验和与先前存储的校验和进行比较。您无需进行任何解压缩即可访问 zip 存档中的元数据。这将非常快。

http://en.wikipedia.org/wiki/Zip_(file_format)

编辑- 实际上,ZipArchive 提供了这个功能。见: http ://www.php.net/manual/en/ziparchive.statindex.php

于 2012-05-21T17:06:33.853 回答
0

您可以仅提取 ZIP 文件的文件部分,然后对它们进行哈希处理,但是您也必须删除元信息!

所以提取文件确实是最简单的解决方案。

于 2012-05-21T16:11:56.357 回答