我正在查看GNU coreutils的源代码,特别是圆形检测。cat
他们正在比较设备和 inode 并且工作正常,但是如果输入为空,他们允许输出作为输入的额外情况。查看代码,这是必须的lseek (input_desc, 0, SEEK_CUR) < stat_buf.st_size)
部分。我阅读了从 中找到的联机帮助页和讨论git blame
,但我仍然不太明白为什么需要此调用lseek
。
这是如何cat
检测的要点,如果它会无限耗尽磁盘(请注意,为简洁起见,还删除了一些错误检查,完整的源代码在上面链接):
struct stat stat_buf;
fstat(STDOUT_FILENO, &stat_buf);
out_dev = stat_buf.st_dev;
out_ino = stat_buf.st_ino;
out_isreg = S_ISREG (stat_buf.st_mode) != 0;
// ...
// for <infile> in inputs {
input_desc = open (infile, file_open_mode); // or STDIN_FILENO
fstat(input_desc, &stat_buf);
/* Don't copy a nonempty regular file to itself, as that would
merely exhaust the output device. It's better to catch this
error earlier rather than later. */
if (out_isreg
&& stat_buf.st_dev == out_dev && stat_buf.st_ino == out_ino
&& lseek (input_desc, 0, SEEK_CUR) < stat_buf.st_size) // <--- This is the important line
{
// ...
}
// } (end of for)
我有两种可能的解释,但似乎都有些奇怪。
- 根据某些标准(posix),文件可能是“空的”,尽管它仍然包含一些信息(用 计数
st_size
)和lseek
/或open
通过默认偏移来尊重这些信息。我不知道为什么会这样,因为空意味着空,对吧? - 这种比较确实是两个条件的“聪明”组合。首先这对我来说是有意义的,因为如果
input_desc
会STDIN_FILENO
并且不会有文件传送到stdin
,lseek
会失败ESPIPE
(根据手册页)并返回-1
。那么,整个语句将是lseek(...) == -1 || stat_buf.st_size > 0
. 但这不可能是真的,因为只有在设备和 inode 相同的情况下才会进行此检查,并且只有在 a) stdin 和 stdout 指向相同的 pty 时才会发生这种情况,但随后out_isreg
会是false
或者 b) stdin 和 stdout 指向同一个文件,但随后lseek
无法返回-1
,对吗?
我还编写了一个小程序,可以打印出返回值和errno
重要部分,但对我来说没有什么突出的:
#include <errno.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <sys/stat.h>
#include <unistd.h>
int main(int argc, char **argv) {
struct stat out_stat;
struct stat in_stat;
if (fstat(STDOUT_FILENO, &out_stat) < 0)
exit(1);
printf("this is written to stdout / into the file\n");
int fd;
if (argc > 1)
fd = open(argv[1], O_RDONLY);
else
fd = STDIN_FILENO;
fstat(fd, &in_stat);
int res = lseek(fd, 0, SEEK_CUR);
fprintf(stderr,
"errno after lseek = %d, EBADF = %d, EINVAL = %d, EOVERFLOW = %d, "
"ESPIPE = %d\n",
errno, EBADF, EINVAL, EOVERFLOW, ESPIPE);
fprintf(stderr, "input:\n\tlseek(...) = %d\n\tst_size = %ld\n", res,
in_stat.st_size);
printf("outsize is %ld", out_stat.st_size);
}
$ touch empty
$ ./a.out < empty > empty
errno after lseek = 0, EBADF = 9, EINVAL = 22, EOVERFLOW = 75, ESPIPE = 29
input:
lseek(...) = 0
st_size = 0
$ echo x > empty
$ ./a.out < empty > empty
errno after lseek = 0, EBADF = 9, EINVAL = 22, EOVERFLOW = 75, ESPIPE = 29
input:
lseek(...) = 0
st_size = 0
因此,我的研究没有触及我的最终问题:如何从源代码lseek
中确定此示例中的文件是否为空?cat