一次Drbd同步故障定位过程

实验室有两台Dell R710做Redhat Cluster。一次电源改造升级,重启机器以后导致IP地址混乱(在启动脚本中重复添加了IP地址),使服务异常。在恢复服务的过程中先后启动了几次服务器,最后发现drbd不同步了,故事的悲剧开始上演了。好在最后发现是双网卡配置同网段的IP地址,且都连接到同一个交换机上,导致的drbd同步失败。

起初根据经验,如果Cluster出现故障,通常情况下重启一下机器就可以解决,但是反复倒腾了几个小时都没有搞定,包括直接强制重建md和重建逻辑卷。初始安装时,drbd安装成功,数据同步也成功. 重启其中一台机器后,发现drbd还是可以同步,但是被我倒腾了[……]

阅读全文