Keepalived,Junos和ARPcaching

我正在尝试在Keepalived的帮助下,在我们公司的数据中心configuration一个主动 – 被动的stunnel设置。 我想知道是否build议在下列情况下使用路由器或交换机重新configuration。

我目前在两个CentOS 6盒中都有一个确认工作安装的stunnel ,它将连接代理到另一个(内部)服务器上的testing页。 我基于本教程的configuration。 (我已经编辑了eth1设备上存在的外部虚拟IP,以保护无辜者)。

 # Box 1 (primary) vrrp_script chk_stunnel { # Requires keepalived-1.1.13 script "killall -0 stunnel" # cheaper than pidof interval 2 # check every 2 seconds weight 2 # add 2 points of prio if OK } vrrp_instance stunnel_cluster { state MASTER interface eth0 virtual_router_id 51 priority 101 advert_int 1 virtual_ipaddress { <VIRTUAL IP>/32 dev eth1 } track_script { chk_stunnel } } # Box 2 (secondary) vrrp_script chk_stunnel { # Requires keepalived-1.1.13 script "killall -0 stunnel" # cheaper than pidof interval 2 # check every 2 seconds weight 2 # add 2 points of prio if OK } vrrp_instance stunnel_cluster { state BACKUP interface eth0 virtual_router_id 51 priority 100 advert_int 1 virtual_ipaddress { <VIRTUAL IP>/32 dev eth1 } track_script { chk_stunnel } } 

当我取下stunnel的主要实例时,系统日志指示辅助框开始发送免费ARP数据包(如预期的那样),但是testing网页不会故障转移,而是变得不可用。 过了一段时间(至less几个小时),第二个箱子终于接pipe了。

对我来说,这听起来像是在我们的至less一个瞻博networking设备(一个面向公众的路由器和一个单独的交换机)上的ARPcaching。 而不是重写默认超时(我相信是6个小时),我宁愿有免费的ARP工作的方式(我认为?)它应该工作,并触发路由表更新。

我相信这个gratuitous-arp-reply设置在这里可能是有用的。 在我们的系统上做这个改变之前,我希望有人知道:

  • 我是否忽略了一个更可能的罪魁祸首是故障转移失败的根源?
  • 如果ARPcaching是问题,这种改变听起来像是一个“标准”的方式去做我想做的事情?
  • 假设一个合理安全的企业networking边界,改变这个设置是否构成不合理的安全风险?
  • 还有什么其他的“陷阱”我应该知道吗?

谢谢。