我们有两个新build的RHEL 5.6 x86_64服务器,它们是Oracle数据库集群的一部分。 一个被命名为CMORAC1 ,另一个被命名为CMORAC2 。 两台服务器的主IP地址分别为10.100.9.144和10.100.9.154 。 每个服务器的networking接口都被绑定,以提高性能和内核级别的负载平衡。
在CMORAC1上 , hostid命令始终返回相同的内容: 640a9009 。 当转换回IP地址时,它提供了10.100.9.144 ,这是正确的IP地址。
然而,在CMORAC2上 , hostid命令的结果非常不一致。 我在循环中运行了50次命令(每个循环之间有1秒的睡眠时间),并给出了不同的hostid。 返回的唯一值是:
640a4a10 640a9909 640a9a09 640a9b09 640a9c09 fea9b8fc
这些hostid相应的IP地址是:
10.100.16.74 10.100.9.153 10.100.9.154 10.100.9.155 10.100.9.156 169.254.252.184
hostid应该总是640a9a09 ,但不是。
这里是CMORAC2的ifconfig:
bond0 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:3F inet addr:10.100.9.154 Bcast:10.100.9.255 Mask:255.255.255.128 inet6 addr: fe80::7a2b:cbff:fe1a:973f/64 Scope:Link UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1 RX packets:2167149212 errors:0 dropped:0 overruns:0 frame:0 TX packets:2169807434 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:0 RX bytes:279381053647 (260.1 GiB) TX bytes:366406519908 (341.2 GiB) bond0:2 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:3F inet addr:10.100.9.153 Bcast:10.100.9.255 Mask:255.255.255.128 UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1 bond0:3 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:3F inet addr:10.100.9.155 Bcast:10.100.9.255 Mask:255.255.255.128 UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1 bond0:4 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:3F inet addr:10.100.9.156 Bcast:10.100.9.255 Mask:255.255.255.128 UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1 bond1 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:43 inet addr:10.100.16.74 Bcast:10.100.16.79 Mask:255.255.255.248 inet6 addr: fe80::7a2b:cbff:fe1a:9743/64 Scope:Link UP BROADCAST RUNNING MASTER MULTICAST MTU:9000 Metric:1 RX packets:517202985 errors:0 dropped:0 overruns:0 frame:0 TX packets:571091767 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:0 RX bytes:330164712285 (307.4 GiB) TX bytes:481545253520 (448.4 GiB) bond1:1 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:43 inet addr:169.254.252.184 Bcast:169.254.255.255 Mask:255.255.0.0 UP BROADCAST RUNNING MASTER MULTICAST MTU:9000 Metric:1 eth0 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:3F UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1 RX packets:1374977659 errors:0 dropped:0 overruns:0 frame:0 TX packets:1556885797 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:172018406954 (160.2 GiB) TX bytes:257910742704 (240.1 GiB) Interrupt:138 Memory:d6000000-d6012800 eth1 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:41 UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1 RX packets:792171553 errors:0 dropped:0 overruns:0 frame:0 TX packets:612921637 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:107362646693 (99.9 GiB) TX bytes:108495777204 (101.0 GiB) Interrupt:146 Memory:d8000000-d8012800 eth2 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:43 UP BROADCAST RUNNING SLAVE MULTICAST MTU:9000 Metric:1 RX packets:13570946 errors:0 dropped:0 overruns:0 frame:0 TX packets:382329420 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:8059679153 (7.5 GiB) TX bytes:310241198851 (288.9 GiB) Interrupt:154 Memory:da000000-da012800 eth3 Link encap:Ethernet HWaddr 78:2B:CB:1A:97:45 UP BROADCAST RUNNING SLAVE MULTICAST MTU:9000 Metric:1 RX packets:503632039 errors:0 dropped:0 overruns:0 frame:0 TX packets:188762347 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:322105033132 (299.9 GiB) TX bytes:171304054669 (159.5 GiB) Interrupt:162 Memory:dc000000-dc012800 lo Link encap:Local Loopback inet addr:127.0.0.1 Mask:255.0.0.0 inet6 addr: ::1/128 Scope:Host UP LOOPBACK RUNNING MTU:16436 Metric:1 RX packets:187853342 errors:0 dropped:0 overruns:0 frame:0 TX packets:187853342 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:0 RX bytes:158085331402 (147.2 GiB) TX bytes:158085331402 (147.2 GiB)
文件/etc/hostid不在服务器上, NetworkManager服务已停止。
这个问题导致我们在使用hostid生成许可证的软件许可方面遇到很多问题。 由于不一致,我们无法保留软件许可。 这个问题是不是发生在其双胞胎CMORAC1 ,根据pipe理谁build立, 应该configuration相同…
有人会有什么想法造成这种情况?
我们发现导致这种行为的问题。 这是DNS相关的。
有多个同名的DNS条目IP:
[root@cmorac2 ~]# nslookup cmorac2 Server: 10.100.9.174 Address: 10.100.9.174#53 Name: cmorac2.cibc.cginet Address: 10.100.9.156 Name: cmorac2.cibc.cginet Address: 10.100.16.74 Name: cmorac2.cibc.cginet Address: 169.254.252.184 Name: cmorac2.cibc.cginet Address: 10.100.9.153 Name: cmorac2.cibc.cginet Address: 10.100.9.154 Name: cmorac2.cibc.cginet Address: 10.100.9.155
在这个纠正之后,返回的hostid是一致的,总是一样的。
这是很好的知道!
我确定以太网绑定导致这个问题。 我想知道如果可能一个解决scheme可能只是致力于eth0,给它一个IP号码,而不是债券,也许甚至不使用它。 这可能会引起一致的结果。 如果你需要这些端口,你可以安装另一个以太网板,我相信他们现在很便宜,假设你在主板上有插槽。
我已经在我的机器上确认,如果一个数字被放置在/ etc / hostid中,hostid命令将一直返回一个数字(hex)。 这可能是解决您的问题的另一种可能的方法。