0

在验证日志中有许多消息后,在我使用 DRBD 的所有系统中。

kernel: block drbd0: Out of sync: start=403446112, size=328 (sectors)

在某些系统中可能会认为这是由工作量决定的,但是有些团队几乎没有工作。

计算机连接在 1Gb 质量的网络中

这些消息并没有给我太多关于系统的信息,最终需要 cron 检查时序,并重置故障块,这当然会在异步系统中转换同步系统。

这是正常的吗?有什么解决办法吗?有错吗?

common {
    protocol C;

handlers {
            pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
    pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
    local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f"                                                                                                                     
}
    syncer {
            # rate after al-extents use-rle cpu-mask verify-alg csums-alg                                                                                                                               
    verify-alg sha1;
       rate 40M;
}
}


resource r0 {
  protocol C;
   startup {
     wfc-timeout  15;     # non-zero wfc-timeout can be dangerous (http://forum.proxmox.com/threads/3465-Is-it-safe-to-use-wfc-timeout-in-DRBD-configuration)
     degr-wfc-timeout 60;
 }
 net {
    cram-hmac-alg sha1;
    shared-secret "XXXXXXXXXX";
    after-sb-0pri discard-zero-changes;
    after-sb-1pri discard-secondary;
    after-sb-2pri disconnect;
 }
 on pro01 {
   device /dev/drbd0;
   disk /dev/pve/vm-100-disk-1;
   address YYY.YYY.YYY.YYY:7788;
    meta-disk internal;
 }
 on pro02 {
   device /dev/drbd0;
    disk   /dev/pve/vm-100-disk-1;
    address YYY.YYY.YYY.YYY:7788;
    meta-disk internal;
  }
}
4

2 回答 2

0

与此相关的故事很长(http://www.gossamer-threads.com/lists/drbd/users/25227),但我仍然不确定这是否可以(或应该)由 DRBD 开发人员或我们需要修复上层行为(在我的例子中是 KVM)。

于 2014-03-19T06:53:53.417 回答
0

它可能会不时发生,这很正常。
只需断开连接并再次连接 - 然后将同步不同步的块。

DRBD - 在线验证

于 2013-02-21T07:14:20.677 回答