我的印象是自从 Unix 系统引入匿名 mmap 以来,RLIMIT_DATA 有点没用,因为 mmap 地址空间不包括在数据段大小中。特别是,glibc malloc() 实现使用匿名 mmap 进行大分配。
然而,我的测试表明,至少在有些非古代 Linux 系统上,匿名 mmap 包含在数据段中。考虑下面的测试程序:
/* Test mmap and ulimit. */
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/mman.h>
#include <string.h>
int print_memstat()
{
char line[80];
FILE *f = fopen("/proc/self/status", "r");
if (!f)
return -1;
while (1) {
if (!fgets(line, 80, f))
break;
if (strncmp(line, "VmSize", 6) == 0
|| strncmp(line, "VmRSS", 5) == 0
|| strncmp(line, "VmData", 6) == 0)
printf("%s", line);
}
fclose(f);
return 0;
}
int main(int argc, char* argv[])
{
if (argc < 3) {
printf("Usage: %s MODE SIZE_IN_MiB\nwhere\n\
MODE=0: Anonymous mmap\n\
MODE=1: mmap of a temporary file\n\
MODE=2: malloc\n", argv[0]);
return 0;
}
int mode = atoi(argv[1]);
long n = atol(argv[2]); // Mem in MiB
n *= 1024*1024;
void *p;
int fd;
char template[] = "/tmp/mmaptestXXXXXX";
switch (mode) {
case 0:
p = mmap(NULL, n, PROT_READ|PROT_WRITE,
MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
if (p == MAP_FAILED) {
perror("anonymous mmap failed");
return 1;
}
break;
case 1:
fd = mkstemp(template);
if (fd == -1) {
perror("mkstemp failed");
return 1;
}
unlink(template);
if (ftruncate(fd, n) == -1) {
perror("ftruncate failed");
return 1;
}
p = mmap(NULL, n, PROT_READ|PROT_WRITE, MAP_PRIVATE, fd, 0);
if (p == MAP_FAILED) {
perror("mmap failed");
return 1;
}
break;
case 2:
p = malloc(n);
if (!p) {
perror("malloc failed");
return 1;
}
break;
default:
printf("MODE must be 0, 1 or 2\n");
return 0;
}
memset(p, 42, n); // Bump up RSS to approx VSS
print_memstat();
return 0;
}
在 RHEL5、6 和 Ubuntu 12.04 上测试。在所有这些上,当使用匿名 mmap() 分配时(使用 glibc malloc() 时 MODE=0 和 MODE=2),数据段大小 (VmData) 会增加以包括分配。
编辑:一些进一步的实验表明,虽然匿名 mmap() 确实增加了 /proc/[PID]/status 中 VmData 字段中报告的数据段大小,但 RLIMIT_DATA 限制仅适用于堆大小,即 brk()分配而不是匿名 mmap()。啊!
现在我的问题是,这种行为在 Linux 上存在多久了,它对其他 Unix 系统的可移植性如何?即,其他 Unix 是否也在数据段大小中包含匿名 mmap?