6

最近我正在查看“dirent”结构(在 dirent.h 中),对它的定义有点困惑。

注意:这个头文件来自我学校的一台 Solaris 机器。


typedef struct dirent {
    ino_t       d_ino;
    off_t       d_off;
    unsigned short  d_reclen;
    char        d_name[1];
} dirent_t;

特别是 d_name 字段。这将如何在操作系统中工作?如果您需要存储一个以空结尾的字符串,那么单个字符的数组有什么用?我知道您可以通过数组的第一个元素获取数组的地址,但我仍然感到困惑。显然发生了什么事,但我不知道是什么。在我家里的 Fedora Linux 系统上,这个字段被简单地定义为:

char d_name[256];

现在,由于显而易见的原因,这更有意义。有人可以解释为什么 Solaris 头文件定义结构吗?

4

4 回答 4

10

正如其他人指出的那样,结构的最后一个成员没有任何设置大小。然而,该数组很长,实现决定它需要容纳它想要放入其中的字符。它通过为结构动态分配内存来做到这一点,例如 with malloc

dirent不过,将成员声明为大小为 1 很方便,因为很容易确定任何变量占用了多少内存d

sizeof(dirent) + strlen(d.d_name)

使用 size 1 也会阻止此类结构值的接收者尝试将自己的名称存储在其中,而不是分配自己的dirent值。使用 Linux 定义,可以合理地假设您拥有的任何dirent值都将接受 255 个字符的字符串,但 Solaris 不保证其dirent值将存储超出其需要的任何字符。

我认为是 C 99 为结构的最后一个成员引入了一种特殊情况。结构体可以这样声明:

typedef struct dirent {
  ino_t d_ino;
  off_t d_off;
  unsigned short d_reclen;
  char d_name[];
} dirent_t;

该数组没有声明的大小。这称为灵活数组成员。它完成了与 Solaris 版本相同的事情,只是不存在结构本身可以拥有任何名称的错觉。你看它就知道它还有更多。

使用“灵活”声明,占用的内存量将调整如下:

sizeof(dirent) + strlen(d.d_name) + 1

这是因为灵活的数组成员不考虑结构的大小。

您没有经常看到这样的灵活声明的原因,尤其是在 OS 库代码中,可能是为了与不支持该功能的旧编译器兼容。它也是为了与针对当前定义而编写的代码兼容,如果结构的大小发生这样的变化,这将破坏。

于 2009-02-18T23:58:47.727 回答
5

dirent 结构将立即在内存中跟随一个包含名称其余部分的内存块,并且可以通过 d_name 字段访问该内存。

于 2009-02-18T22:10:25.270 回答
5

这是 C 语言中用于指示结构末尾的任意长度数组的模式。C 中的数组没有内置的边界检查,因此当您的代码尝试访问从 d_name 开始的字符串时,它将继续超过结构的末尾。这依赖于readdir()将分配足够的内存来保存整个字符串加上终止的 nul。

于 2009-02-18T22:11:09.793 回答
1

对我来说,它看起来像是一个微优化。名称通常很短,所以为什么要分配您知道将不会使用的空间。此外,Solaris 可能支持超过 255 个字符的名称。要使用这样的结构,您只需分配所需的空间并忽略假定的数组大小。

于 2009-02-18T22:12:38.777 回答