networking故障后的DRBD状态变为主要/未知

我有以下结构:

  • 2个节点。
  • corosync +起搏器+ DRBD + OCFS2。

==============

在testingnetworking失败后,状态从DRBD变成:

****小学/未知****

dmesg显示以下内容:

裂脑检测到但未解决,断开连接。

我可以通过命令手动从DRBD到主/主返回的状态,但我希望自动。

我的configuration是: / etc / corosync / r0

resource r0 { protocol C; startup { become-primary-on both; } disk { on-io-error detach; fencing resource-only; resync-rate 1000M; } handlers { split-brain "/usr/lib/drbd/notify-split-brain.sh root"; fence-peer "/usr/lib/drbd/crm-fence-peer.sh"; after-resync-target "/usr/lib/drbd/crm-unfence-peer.sh"; } net { allow-two-primaries yes; cram-hmac-alg sha1; shared-secret "DRBD Super Secret Password"; timeout 180; ping-int 3; ping-timeout 9; allow-two-primaries; after-sb-0pri discard-zero-changes; after-sb-1pri discard-secondary; after-sb-2pri disconnect; } on node01 { device /dev/drbd0; address 192.168.64.128:7788; meta-disk internal; disk /dev/mapper/SSDVolume-VMData; } on node02 { device /dev/drbd0; address 192.168.64.129:7788; meta-disk internal; disk /dev/mapper/SSDVolume-VMData; } 

}


我的crmconfiguration显示是:

 primitive drbd_r0 ocf:linbit:drbd \ params drbd_resource=r0 \ op monitor interval=20 role=Master timeout=30 \ op monitor interval=30 role=Slave timeout=40 primitive filesys Filesystem \ params device="/dev/drbd0" directory="/vmstore" fstype=ocfs2 options="rw,noatime" \ op start interval=0 timeout=60 \ op stop interval=0 timeout=60 primitive virtual_ip IPaddr2 \ params ip=192.168.38.10 cidr_netmask=32 \ op monitor interval=10s \ meta migration-threshold=10 ms ms_drbd_r0 drbd_r0 \ meta master-max=2 master-node-max=1 notify=true clone filesys_clone filesys \ meta interleave=true colocation col_filesys_clone-on-drbd_master inf: filesys_clone ms_drbd_r0:Master order filesys_clone-after-drbd_master inf: ms_drbd_r0:promote filesys_clone:start property cib-bootstrap-options: \ have-watchdog=false \ dc-version=1.1.14-70404b0 \ cluster-infrastructure=corosync \ cluster-name=debian \ stonith-enabled=false \ no-quorum-policy=ignore rsc_defaults rsc-options: \ resource-stickiness=100 

我的问题是:

我应该怎么做才能从DRBD Primary / Primary再次自动获取状态?

先谢谢了

在双主节点中运行DRBD时,复制networking的任何中断将导致裂脑。 您需要按照以下用户指南中的步骤手动解决此问题: https : //docs.linbit.com/doc/users-guide-84/s-resolve-split-brain/

更重要的是,您在没有STONITH和防护的双主服务器上运行DRBD。 这很危险,最终会让你失望。 您将丢失数据或损坏您的数据。 不build议或者支持使用这样的DRBD。

祝你好运!