openebs - 如何确保从应用程序写入的数据与 OpenEBS 中的 ext4 同步到磁盘？

Question

重启后数据不可见。我猜测数据被传递给副本以写入，然后将其放入 ext4。但是在 ext4 可以将数据同步到磁盘之前，节点会重新启动并且数据不会下推到 EBS 磁盘。

有没有办法解决这个问题？我正在openebs使用jiva. 我有我的MySQL -> ext4 (iscsi volume) -> Replica -> ext4 (block disks - say Amazon EBS).

有时，我观察到，如果运行 Replica 的节点重新启动...

score 1 · Accepted Answer

这是lwn.net 上的一篇文章，它详细讨论了程序无法在 ext4 上进行充分同步（也称为崩溃一致性）时潜在的数据丢失（评论讨论也很有启发性）。

ext3 显然在使用时实现了更好的崩溃一致性，data=ordered因为它在元数据更改提交到日志之前强制数据到磁盘。此外，使用 5 秒的默认提交周期。在 ext4 的情况下，使用延迟物理块分配模型进行性能权衡，从而导致未提交的数据继续存在于缓存中一段时间。引用文章：

内核不喜欢让文件数据长时间处于未写入状态，但刷新数据仍可能需要一分钟左右（使用默认设置） - 远远长于 ext3 通常看到的 5 秒

因此，未写入的数据理论上只能存在于易失性缓存中，直到它被系统范围强制写入磁盘sync或应用程序显式fsync显示其自己的数据（正如 Jeffery 指出的那样）。如果应用程序/客户端不这样做，我们更容易丢失数据。

缓解此问题的一种方法是使用选项挂载所需的文件系统sync（请参阅此“ext4 和数据丢失”讨论线程），为此我们必须在两个地方强制执行它：

装入吊舱
OpenEBS 存储池或后端存储

（在 1 的情况下，我们可以让目标将所有写入转换为同步，正如 Jeffery 所解释的）

虽然mount(8)文档明确指出，-o sync仅在ext3（在 ext 系列文件系统中）之前支持 using，但接受使用此选项的手动文件系统挂载。为了检查它是否是挂载协议允许但被 ext4 忽略的东西，我对 256M 的数据样本大小进行了一个基于 fio 的小型随机写入性能测试，磁盘使用同步选项挂载，并且与一个没有它。为了确保写入本身不是 SYNC 写入，使用direct=1and iodepth=4（异步多线程无缓冲 I/O）选择了 libaio ioengine。结果显示大约 300+ IOPS 的差异（当然，非sync挂载性能更好）。这一结果表明，sync挂载标志似乎确实起作用，但我仍在寻找更多证据。

openebs - 如何确保从应用程序写入的数据与 OpenEBS 中的 ext4 同步到磁盘？

1 回答 1

Related

Reference