1

我们需要一个应用程序来尽可能地保证当它报告一条记录时,它确实是持久的。我知道要做到这一点,你使用fsync(fd). 然而,出于某种奇怪的原因,使用 fsync() 似乎加快了写入磁盘的代码,而不是像预期的那样减慢它。

一些示例测试代码返回以下结果:

no sync() seconds:0.013388   writes per second:0.000001 
   sync() seconds:0.006268   writes per second:0.000002

下面是产生这些结果的代码:

#include <stdio.h>
#include <fcntl.h>
#include <time.h>
#include <unistd.h>

void withSync() {
    int f = open( "/tmp/t8" , O_RDWR | O_CREAT );
    lseek (f, 0, SEEK_SET );
    int records = 10*1000;
    clock_t ustart = clock();
    for(int i = 0; i < records; i++) {
        write(f, "012345678901234567890123456789" , 30);
        fsync(f);
    }
    clock_t uend = clock();
    close (f);
    printf("   sync() seconds:%lf   writes per second:%lf\n", ((double)(uend-ustart))/(CLOCKS_PER_SEC), ((double)records)/((double)(uend-ustart))/(CLOCKS_PER_SEC));
}

void withoutSync() {
    int f = open( "/tmp/t10" , O_RDWR | O_CREAT );
    lseek (f, 0, SEEK_SET );
    int records = 10*1000;
    clock_t ustart = clock();
    for(int i = 0; i < records; i++) {
        write(f, "012345678901234567890123456789" , 30 );
    }
    clock_t uend = clock();
    close (f);
    printf("no sync() seconds:%lf   writes per second:%lf \n", ((double)(uend-ustart))/(CLOCKS_PER_SEC), ((double)records)/((double)(uend-ustart))/(CLOCKS_PER_SEC));
}

int main(int argc, const char * argv[])
{
    withoutSync();
    withSync();
    return 0;
}
4

2 回答 2

9

问题在于您尝试对 I/O 写入计时的方式。从语义上讲,您希望测量I/O 记录写入之间的挂钟时间,但您使用的是 C 库函数clock,它测量 CPU 执行时间而不是经过的总时间。clock_gettime与时钟选择一起使用,CLOCK_MONOTONIC或者,理想情况下,CLOCK_MONOTONIC_RAW(后者是 Linux 扩展)。

您没有收集调用之间经过的总时间clock:您正在收集您的进程旋转 CPU 周期的时间量的估计值。您的磁盘 I/O(特别是对write和的调用fsync)正在阻塞,这意味着这些系统调用中的每一个都由内核代表您处理,并且不会在您的进程上下文中消耗 CPU。因此,您需要测量挂钟时间的实际差异,这听起来是现实世界中经过的总时间,超出了您的测试程序过程的范围。事实上,你关心的根本不是 CPU 时间fsync。大多数 I/O 操作的执行时间不会由内核甚至 CPU 处理;这将是由于磁盘控制器。

此外,小记录大小也可以作为基准。这是同步 I/O 的常见用例(例如,为事务日志写入元数据)。要获得较大记录大小的时序稳定性,只需显着增加每个计时器间隔和平均/摊销的循环迭代次数。这将准确地模拟同步写入和刷新的小阻塞记录的成本。

请考虑fdatasync提高性能。

于 2012-11-12T04:00:10.447 回答
0

非常感谢您的意见,谢谢!建议将测试增加到更多事务的评论是正确的。当使用大量事务时fsync(),似乎确实有所作为。至少在 OS/X 10.8 上:

  1. 当写入不增加文件大小时,fsync()完成写入所需的时间加倍。
  2. 当写入确实增加了文件大小时,fsync()速度会明显变慢。
于 2012-11-12T03:06:17.170 回答