1

我不明白为什么在 lseek 之后调用 read 会返回 0 读取的字节数。

//A function to find the next note for a given userID;
//returns -1 if at the end of file is reached;
//otherwise, it returns the length of the found note.
int find_user_note(int fd, int user_uid) {
    int note_uid = -1;
    unsigned char byte;
    int length;

    while(note_uid != user_uid) { // Loop until a note for user_uid is found.
        if(read(fd, &note_uid, 4) != 4) // Read the uid data.
            return -1; // If 4 bytes aren't read, return end of file code.
        if(read(fd, &byte, 1) != 1) // Read the newline separator.
            return -1;

        byte = length = 0;
        while(byte != '\n') { // Figure out how many bytes to the end of line.
            if(read(fd, &byte, 1) != 1) // Read a single byte.
                return -1; // If byte isn't read, return end of file code.

            //printf("%x ", byte);
            length++;
        }
    }
    long cur_position = lseek(fd, length * -1, SEEK_CUR ); // Rewind file reading by length bytes.

    printf("cur_position: %i\n", cur_position);

    // this is debug
    byte = 0;
    int num_byte = read(fd, &byte, 1);

    printf("[DEBUG] found a %d byte note for user id %d\n", length, note_uid);
    return length;
}

当存在外部while循环时,可变长度值为34,并且上面的代码产生cur_position 5(因此lseek函数返回后肯定至少有34个字节),但是从函数读取返回的变量num_byte总是返回0,即使有还有更多字节要读取。

有谁知道 num_byte 总是返回 0 的原因?如果这是我的代码中的错误,我看不到它是什么。

仅供参考,上面的代码是在以下机器上运行的

$ uname -srvpio
Linux 3.2.0-24-generic #39-Ubuntu SMP Mon May 21 16:52:17 UTC 2012 x86_64 x86_64 GNU/Linux

更新:

  • 我在这里上传完整的代码
  • 这是我尝试阅读的文件内容
$ sudo hexdump -C /var/notes
00000000  e8 03 00 00 0a 74 68 69  73 20 69 73 20 61 20 74  |.....this is a t|
00000010  65 73 74 20 6f 66 20 6d  75 6c 74 69 75 73 65 72  |est of multiuser|
00000020  20 6e 6f 74 65 73 0a                              | notes.|
00000027

$
4

3 回答 3

6

如果length是小于的无符号类型off_t(例如,size_t在 32 位机器上),那么length*-1将是一个巨大的值(可能在 4GB 左右)。这可能是问题所在。将结果存储lseek到 a long(同样,如果它是 32 位)将应用实现定义的转换,可能会截断,这会再次给您留下一个小值。

我看到您的机器是 64 位的,但也许您正在运行 32 位用户空间?

在任何情况下,为什么不运行你的程序strace来看看它在做什么系统调用呢?这几乎肯定会很快解决这个问题。

于 2012-06-10T04:33:11.910 回答
4

终于找到问题了!!!我必须#include <unistd.h>输入才能使用正确的 lseek()。但是,我不确定为什么不包含unistd.h它是可编译的,尽管会导致意外行为。我认为如果不包括函数的原型,它甚至不应该是可编译的。

代码是由 Jon Erickson 在Hacking: The Art of Exploitation 2nd Edition中编写的,我已经证实在书中没有#include <unistd.h>.

于 2012-06-18T01:23:46.377 回答
1

将初始可变长度设置为 34,上述代码将产生 cur_position 5(因此 lseek 函数返回后肯定至少有 34 个字节)

这不一定是这种情况,因为人们可以在文件末尾之外四处寻找而不会出现任何错误。

lseek()请参阅下面的手册页摘录:

lseek() 函数允许将文件偏移量设置为超出文件末尾(但这不会改变文件的大小)。

因此,人们很可能会收到一个值 form lseek()ing,它仍然指向文件末尾之外。所以read()从这个位置 ing 仍然会返回 0 (因为它超出了文件结尾)。


我也同意 R..,在使用正确的类型(使用的方法使用的类型)时更加小心并不是一个坏主意。


更新:您还可以注意包含您调用的系统函数的所有标题。要检查这种情况,我强烈建议使用gccs 选项-Wall来打开所有编译器警告,它们是免费的...... ;-)

于 2012-06-10T10:46:46.910 回答