2

发现这个: https ://stackoverflow.com/a/11373078/530599 - 很好,但是

怎么样stream_filter_append($fp, 'zlib.inflate', STREAM_FILTER_*

寻找另一种解压缩数据的方法。

$fp = fopen($src, 'rb');
$to = fopen($output, 'wb');

// some filtering here?
stream_copy_to_stream($fp, $to);
fclose($fp);
fclose($to);

例如 200+ Mb$src的一些网址在哪里:)http://.../file.gz

添加了有效的测试代码,但分两步:

<?php

    $src = 'http://is.auto.ru/catalog/catalog.xml.gz';
    $fp = fopen($src, 'rb');
    $to = fopen(dirname(__FILE__) . '/output.txt.gz', 'wb');
    stream_copy_to_stream($fp, $to);
    fclose($fp);
    fclose($to);

    copy('compress.zlib://' . dirname(__FILE__) . '/output.txt.gz', dirname(__FILE__) . '/output.txt');
4

2 回答 2

5

尝试gzopen打开一个 gzip (.gz) 文件进行读取或写入。如果文件未压缩,它会透明地读取它,因此您可以安全地读取非 gzip 压缩文件。

$fp = gzopen($src, 'rb');
$to = fopen($output, 'w+b');
while (!feof($fp)) {
    fwrite($to, gzread($fp, 2048)); // writes decompressed data from $fp to $to
}

fclose($fp);
fclose($to);
于 2012-08-12T19:10:58.170 回答
4

PHP 的流过滤子系统中令人讨厌的遗漏之一是缺少 gzip 过滤器。Gzip 本质上是使用 deflate 方法压缩的内容。然而,它在压缩数据之前添加了一个 2 字节的标头,并在末尾添加了一个 Adler-32 校验和。如果你只是将一个 zlib.inflate 过滤器添加到流中,它是行不通的。在附加过滤器之前,您必须跳过前两个字节。

请注意,PHP 5.2.X 版本中的流过滤器存在严重错误。这是由于流缓冲。基本上 PHP 将无法通过过滤器传递流的内部缓冲区中已经存在的数据。如果您在附加膨胀过滤器之前执行 fread($handle, 2) 来读取 gzip 标头,那么它很有可能会失败。调用 fread() 将导致 PHP 尝试填满其缓冲区。即使对 fread() 的调用只要求两个字节,PHP 实际上可能会从物理介质中读取更多字节(比如说 1024)以尝试提高性能。由于上述错误,额外的 1022 字节不会发送到解压缩例程。

于 2012-08-12T23:33:10.437 回答