2

我正在实现 tail 函数,我只应该使用read(),write()lseek()I/O,到目前为止我有这个:

int printFileLines(int fileDesc)
{
    char c; 
    int lineCount = 0, charCount = 0;   
    int pos = 0, rState;
    while(pos != -1 && lineCount < 10)
    {
        if((rState = read(fileDesc, &c, 1)) < 0)
        {
            perror("read:");
        }
        else if(rState == 0) break;
        else
        {
            if(pos == -1)
            {
                pos = lseek(fileDesc, 0, SEEK_END);
            }
            pos--;
            pos=lseek(fileDesc, pos, SEEK_SET); 
            if (c == '\n')
            {
                lineCount++;
            }
            charCount++;
        }
    }

    if (lineCount >= 10)
        lseek(fileDesc, 2, SEEK_CUR);
    else
        lseek(fileDesc, 0, SEEK_SET);

    char *lines = malloc(charCount - 1 * sizeof(char));

    read(fileDesc, lines, charCount);
    lines[charCount - 1] = 10;
    write(STDOUT_FILENO, lines, charCount);

    return 0;
}

到目前为止,它适用于超过 10 行的文件,但是当我传递一个少于 10 行的文件时它会刹车,它只打印该文件的最后一行,我无法让它与stdin. 如果有人能给我一个如何解决这个问题的想法,那就太好了:D

4

1 回答 1

2

第一个问题:

如果您在这里阅读换行符...

if(read(fileDesc, &c, 1) < 0)
{
    perror("read:");
}

...然后将位置直接设置为该换行符之前的字符...

pos--;
pos=lseek(fileDesc, pos, SEEK_SET);

然后linecount>= 10(while循环终止),那么您读取的第一个字符是最后一个换行符之前的行的最后一个字符。换行符本身也不是最后 10 行的一部分,因此只需从当前流位置跳过两个字符:

if (linecount >= 10)
    lseek(fileDesc, 2, SEEK_CUR);

对于第二个问题:

让我们假设,流偏移已到达流的开头:

pos--;
pos=lseek(fileDesc, pos, SEEK_SET); // pos is now 0

while 条件仍然为 TRUE:

while(pos != -1 && lineCount < 10)

现在读取一个字符。在此之后,文件偏移量为1(第二个字符):

if(read(fileDesc, &c, 1) < 0)
{
    perror("read:");
}

在这里, pos 下降到 -1 并且 lseek 将失败

pos--;
pos=lseek(fileDesc, pos, SEEK_SET); 

由于 lseek 失败,文件中的位置现在是第二个字符,因此缺少第一个字符。pos == -1如果在 while 循环之后,通过将文件偏移量重置为文件开头来解决此问题:

if (linecount >= 10)
    lseek(fileDesc, 2, SEEK_CUR);
else
    lseek(fileDesc, 0, SEEK_SET);

表现:

这需要非常多的系统调用。一个简单的增强是使用缓冲的 f* 函数:

FILE *f = fdopen(fileDesc, "r");
fseek(...);
fgetc(...);

等等。此外,这不需要系统特定的功能。

更好的是逐块向后读取文件并对这些块进行操作,但这需要更多的编码工作。

对于 Unix,您还可以mmap()搜索整个文件并在内存中向后搜索换行符。

于 2016-01-18T19:26:35.013 回答