4

我有一个应用程序可以读取$stdin数据并对其进行一些处理。我想放入一个信号处理程序来捕获 SIGINT/SIGTERM 并正常关闭(意味着完成数据处理并在完成后退出)。棘手的部分是我希望它停止从 STDIN 读取但能够处理任何缓冲数据。这样就可以启动另一个应用程序并通过相同的 STDIN 管道并在前一个应用程序停止的地方继续处理。

问题是,如果我关闭 STDIN,缓冲的任何内容都会丢失,或者至少无法访问。

基本上我正在尝试这个:

#!/usr/bin/ruby

Signal.trap('INT') do
    $stdin.close
end

f = File.open('/tmp/out', 'a')
while (data = $stdin.read(4096)) != "" do
    f.write(data)
end

即使我知道它读取了一些数据(strace 显示它),它也会立即在调用中给出IOError异常。$stdin.read

(我不需要关闭管道,我只是为了打破while循环。如果有更优雅的方式来打破循环并获取缓冲数据,我很乐意接受。)


我知道这种方法适用于操作系统级别(传递给另一个应用程序时会保留管道缓冲区),因为我可以进行以下测试并且不会丢失任何数据:

# source.rb
i = 0
loop do
    puts "%08d" % (i += 1)
end

.

# reader.rb
$stdout.write($stdin.read(9))
$stdin.close

.

ruby /tmp/source.rb | while true; do ruby reader.rb; sleep 1; done
00000001
00000002
00000003
00000004
00000005
4

2 回答 2

0

在为此苦苦挣扎了几天之后,我最终不得不放弃IO.read并使用IO.sysread并自己进行缓冲。这个解决方案真的没有那么复杂,下面是实现。

Signal.trap('INT') do
    $stdin.close
end

def myread(bufio, bytes) # `bufio` is a StringIO object, `bytes` is bytes to read
    begin
        while bufio.size < bytes do
            bufio.write($stdin.sysread(bytes - bufio.size))
        end
    rescue SignalException, Interrupt, Errno::EINTR => e
        retry
    rescue SystemCallError, IOError, EOFError => e
        # nothing, we're done
    end
end

我的确切代码与我使用 AWS ruby​​ SDK 时的代码略有不同,因此该myread方法实际上只是传递给AWS::S3::S3Object.write

于 2013-07-30T15:49:31.853 回答
0

解决此问题的一种方法是在关闭原始文件之前复制文件描述符,然后错误将中断循环,您可以从未关闭的重复文件句柄中读取其余数据。

(对不起,如果这段代码不好,我不知道 ruby​​)

#!/usr/bin/ruby

require 'fcntl'

stdin_dup = nil

Signal.trap('INT') do
  stdin_dup = File.for_fd($stdout.fcntl(Fcntl::F_DUPFD))
  $stdin.close
end

f = File.open('/tmp/out', 'a')
begin
  while (data = $stdin.read(4096)) != "" do
    f.write(data)
  end
rescue IOError
  # finish stuff with stdin_dup here
end
于 2013-07-27T03:55:10.803 回答