我的理解是,我可以通过mmap
对文件执行操作然后调用mlock
映射内存来将文件保存在内存中。
有没有办法在不做 mmap 的情况下将文件数据保存在页面缓存中?具体来说,我想确保当我将数据附加到文件时,我正在写入的页面永远不会被驱逐。
我意识到这种情况很少见,但在某些情况下我相信它可能会发生。例如,应用程序写入数据,等待时间超过dirty_writeback_centisecs
(在此之后页面变干净并且可以被驱逐),然后写入更多数据。
我的理解是,我可以通过mmap
对文件执行操作然后调用mlock
映射内存来将文件保存在内存中。
有没有办法在不做 mmap 的情况下将文件数据保存在页面缓存中?具体来说,我想确保当我将数据附加到文件时,我正在写入的页面永远不会被驱逐。
我意识到这种情况很少见,但在某些情况下我相信它可能会发生。例如,应用程序写入数据,等待时间超过dirty_writeback_centisecs
(在此之后页面变干净并且可以被驱逐),然后写入更多数据。
我相信你在理解什么方面有点错误mlock
。它的预期用途是:
因此它断言页面已加载到 RAM 中并防止它们被换出。不能保证它会阻止从文件映射的脏页的写回(实际上并没有,请参见下面的实验)。
提示内核您将很快从 fd进行一些读取posix_fadvise()
,所以
posix_fadvise(fd, offset, len, POSIX_FADV_RANDOM);
可能会将文件的请求部分加载到页面缓存中。
我不能肯定地说,但我想实际上没有办法像现在一样禁止写回特定文件的脏页。可能有一些方法可以暗示它,但我也没有看到。
alexander@goblin ~/tmp $ cat mmap.c
#include <sys/mman.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#define handle_error(msg) \
do { perror(msg); exit(EXIT_FAILURE); } while (0)
int main(int argc, char *argv[]) {
char *addr;
int fd;
struct stat sb;
size_t length;
if (argc != 2) {
fprintf(stderr, "%s file\n", argv[0]);
exit(EXIT_FAILURE);
}
fd = open(argv[1], O_RDWR);
if (fd == -1) {
handle_error("open");
}
if (fstat(fd, &sb) == -1) { /* To obtain file size */
handle_error("fstat");
}
length = sb.st_size;
addr = mmap(NULL, length , PROT_READ|PROT_WRITE, MAP_SHARED, fd, 0);
if (addr == MAP_FAILED) {
handle_error("mmap");
}
if(mlock(addr, length)<0) {
handle_error("mlock");
}
strcpy(addr, "hello world!");
sleep(100);
munmap(addr, length);
close(fd);
exit(EXIT_SUCCESS);
}
alexander@goblin ~/tmp $ grep . /proc/sys/vm/dirty_{expire,writeback}_centisecs
/proc/sys/vm/dirty_expire_centisecs:1000
/proc/sys/vm/dirty_writeback_centisecs:500
alexander@goblin ~/tmp $ dd if=/dev/zero of=foo bs=4k count=1
1+0 records in
1+0 records out
4096 bytes (4.1 kB, 4.0 KiB) copied, 8.1296e-05 s, 50.4 MB/s
alexander@goblin ~/tmp $ fallocate -l 4096 foo
alexander@goblin ~/tmp $ sync foo
alexander@goblin ~/tmp $ sudo hdparm --fibmap foo
foo:
filesystem blocksize 4096, begins at LBA 0; assuming 512 byte sectors.
byte_offset begin_LBA end_LBA sectors
0 279061632 279061639 8
alexander@goblin ~/tmp $ sudo dd if=/dev/mapper/vg_main-gentoo_home count=8 skip=279061632 iflag=nocache 2>/dev/null | hexdump -C
00000000 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
*
00001000
alexander@goblin ~/tmp $ gcc mmap.c
alexander@goblin ~/tmp $ ./a.out foo &
[1] 26450
alexander@goblin ~/tmp $ sudo hdparm --fibmap foo
foo:
filesystem blocksize 4096, begins at LBA 0; assuming 512 byte sectors.
byte_offset begin_LBA end_LBA sectors
0 279061632 279061639 8
alexander@goblin ~/tmp $ sudo dd if=/dev/mapper/vg_main-gentoo_home count=8 skip=279061632 iflag=nocache 2>/dev/null | hexdump -C
00000000 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
*
00001000
alexander@goblin ~/tmp $ sleep 10
alexander@goblin ~/tmp $ sudo hdparm --fibmap foo
foo:
filesystem blocksize 4096, begins at LBA 0; assuming 512 byte sectors.
byte_offset begin_LBA end_LBA sectors
0 279061632 279061639 8
alexander@goblin ~/tmp $ sudo dd if=/dev/mapper/vg_main-gentoo_home count=8 skip=279061632 iflag=nocache 2>/dev/null | hexdump -C
00000000 68 65 6c 6c 6f 20 77 6f 72 6c 64 21 00 00 00 00 |hello world!....|
00000010 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
*
00001000
alexander@goblin ~/tmp $ fg
./a.out foo
^C