5

我正在阅读 PHP 中的流,使用 proc_open 和 fgets($stdout),试图获取每一行。

许多 linux 程序(包管理器、wget、rsync)只是使用 CR(回车)字符来表示定期“就地”更新的行,比如下载进度。我想在这些更新发生时立即捕获它们(作为单独的行)。

目前, fgets($stdout) 一直读取到 LF,因此当进度非常缓慢(例如大文件)时,它会一直读取直到完全完成,然后将所有更新的行作为一个长字符串返回,包括CR。

我尝试设置“mac”选项以将 CR 检测为行尾:

ini_set('auto_detect_line_endings',true); 

但这似乎不起作用。

现在,stream_get_line 将允许我将 CR 设置为换行符,但不是将 CRLF、CR 和 LF 都视为分隔符的“包罗万象”解决方案。

我当然可以阅读整行,使用各种 PHP 方法拆分它,并用 LF 替换所有类型的换行符,但它是一个流,我希望 PHP 能够在它仍在运行时获得进度指示。

所以我的问题:

如何从 STDOUT 管道(从 proc_open)读取直到发生 LFCR,而不必等到整行都进入?

提前致谢!

解决方案:

我使用 Fleshgrinder 的过滤器类将流中的 \r 替换为 \n (请参阅接受的答案),并将 fgets() 替换为 fgetc() 以获得对 STDOUT 内容的更多“实时”访问:

$stdout = $proc->pipe(1);
stream_filter_register("EOL", "EOLStreamFilter");
stream_filter_append($stdout, "EOL"); 

while (($o = fgetc($stdout))!== false){
    $out .= $o;                            // buffer the characters into line, until \n.
    if ($o == "\n"){echo $out;$out='';}    // can now easily wrap the $out lines in JSON
}
4

1 回答 1

2

在使用流之前,使用流过滤器规范化换行符。我创建了以下代码,该代码应该基于 PHP 手册页上的示例来实现stream_filter_register

代码未经测试!

<?php

// https://php.net/php-user-filter
final class EOLStreamFilter extends php_user_filter {

    public function filter($in, $out, &$consumed, $closing)
    {
        while ($bucket = stream_bucket_make_writeable($in)) {
            $bucket->data = str_replace([ "\r\n", "\r" ], "\n", $bucket->data);
            $consumed += $bucket->datalen;
            stream_bucket_append($out, $bucket);
        }
        return PSFS_PASS_ON;
    }

}

stream_filter_register("EOL", "EOLStreamFilter");

// Open stream …

stream_filter_append($yourStreamHandle, "EOL");

// Perform your work with normalized EOLs …

编辑:马克贝克在你的问题上发表的评论是真实的。大多数 Linux 发行版都使用行缓冲区STDOUT,Apple 可能也在这样做。另一方面,大多数STDERR流是无缓冲的。您可以尝试将程序的输出重定向到另一个管道(例如STDERR或任何其他管道),看看您是否有更多的运气。

于 2015-01-12T18:17:12.693 回答