我是一名软件工程师,他在2周的多服务器托pipe环境中尝试检测(并尽可能解决)奇怪的本地networking问题。 我们从一家欧洲的托pipe公司购买了3个专用的32GB ram 8核心i7 CPU。 每个盒子有两个接口,一个用于外部通信,一个用于本地通信。 然后我们聘请系统工程师来设置我们的初始环境。 世界多么精彩。 一切都很好,直到部署..在下面的服务器上部署应用程序的问题开始: 服务器1(DB):32 GB,8核心,2个接口,仅运行2个服务:ubuntu上的mysql 5.5使用memcached的12.04 LTS 1.4.13-0ubuntu2 服务器2(www):32 GB,8核心,2接口,运行php5-fpm(v5.5),nginx 1.4.4&crontab在Ubuntu 12.04 LTS 服务器3(Solr):32 GB,8核心,2个接口,仅运行一个服务:在Ubuntu 12.04上使用Solr 4.5的Tomcat7使用memcached的LTS 1.4.13-0ubuntu2 部署后,我们发现我们的应用程序的批量索引过程非常缓慢。 在批量索引时,应用程序从数据库(从srv1)读取数据(在阶段没有最终用户stream量),处理它并生成更多的扩展数据,在memcached(srv1)上将新数据caching为多个块并在solr上build立索引。 我花了5-6天的时间在应用程序方面find任何可能的瓶颈或应用程序相关的问题,但没有发现。 当在服务器上运行我们的索引cron时,应用程序挂起,等待,有时抛出与memcached(NOT FOUND)有关的连接错误,但有时不成功,传递成功读取阶段并抛出与mysql连接有关的另一个连接exception。 DB正在运行,mysql.log中没有错误行。 Memcached启动并运行,没有错误日志事件非常详细(-vvv)日志logging打开。 我一次又一次地检查应用程序,循环中没有查询(查询已被优化),没有不必要的memcached连接 – 循环操作(我们在批量读取和写入时使用multi_get – multi_set方法) 然后我试图切换我的应用程序configuration使用我们的外部IP地址(120.144.XX),而不是使用本地(10.10.XX)和繁荣! 应用程序开始飞行。 问题和例外消失了,像风一样完美无缺。 我们的系统工程师们越来越多地在硬件和接线方面进行了深入探讨,并与数据中心进行了多次交谈,testing,再次testing,但最后一点是:“您的硬件和接线没问题,请检查您的networkingconfiguration和应用程序。 Sysengineer说,“在本地networking上configuration-ipv6是不必要的,所以我们可以在会议中完全closures”。 我不知道为什么。 对话之后,我不再提出任何问题。 几天后,我们公司又雇佣了另一个不喜欢ipv6的sysengineer,我感到非常惊讶。 我的第一个问题是,为什么两个sysengineers恨ipv6? ipv6的问题是什么? 我们的应用程序的主要问题是现在它与memcached和mysql使用外部IP地址交谈,我们想要使用本地networking。 它完美的外部IP的,但不是本地的。 我不知道问题在哪里,我不是一个系统或networking工程师,我不知道他们在系统中做了什么,但我相信有一个错误的迁移问题。 这两个sysengineers被否认没有错,但我想挖这更多。 我可以从哪里开始? 什么是find问题的适当工具? 这些输出是否正常: [email protected] ~ […]
我想通过openvpn (tun0)通过特定域的stream量,其余通过eth0如何configurationopenvpn使用eth0? 使用ddclient设置域名来更新dynamicDNS。 但我使用tcpdump进行检查,并且不会从tun0中捕获请求 tcpdump -vv -i tun0 tcpdump: listening on tun0, link-type RAW (Raw IP), capture size 65535 bytes ^C 0 packets captured 23 packets received by filter 0 packets dropped by kernel 我试过了: ifconfig eth0:1 xxx131 up ifconfig tun0 tun0 Link encap:UNSPEC HWaddr 00-00-00-00-00-00-00-00-00-00-00-00-00-00-00-00 inet addr:xxx131 PtP:xxx131 Mask:255.255.255.128 UP POINTOPOINT RUNNING NOARP MULTICAST […]
我有一个运行ubuntu 12.04服务器(名称= vmhost)的vmware虚拟机,具有networking桥接和完全访问互联网。 这个虚拟主机正在使用kvm虚拟机pipe理程序,并运行一个vm(centOS 6.4),networking桥接以及。 虚拟主机可以访问互联网,也可以访问虚拟主机,虚拟主机可以访问虚拟主机。 虚拟机不能访问互联网,也不能从我的子网上的另一台PC ping / ssh到它。 我有一个vmhost /它的VM的桥梁,并已检查iptables /路线,但没有发现任何东西。 另外我有ip_forwarding。 运行tcpdump我发现vmhost可以看到软件包,但是什么也不做。 我也尝试禁用ufw,但没有帮助。 Infor VHMOST路线: 内核IP路由表 Destination Gateway Genmask Flags Metric Ref Use Iface default 192.168.0.1 0.0.0.0 UG 100 0 0 virbr0 192.168.0.0 * 255.255.255.0 U 0 0 0 virbr0 The vmhouste Iptables -l Chain INPUT (policy ACCEPT) target prot opt source […]
我们有一个600用户的中型networking,全部都在思科交换机上。 允许用户在端点上插入路由器等,以便他们可以在他们的房间中使用无线和/或多个设备。 问题是,我们遇到了VLANS(一个相当大的)之一的不稳定性问题。 DHCP服务器应该工作正常,因为其他的VLAN是好的。 奇怪的是,这种情况发生在互联网被报告为“缓慢”的爆发中,这是以前没有报道过的。 这些事件以前没有发生在我们当前的configuration上,而且我们没有改变configuration。 DNS也很好,所以这是不可能的。 然而,有很多人已经进入这些build筑,他们可能已经堵塞了一些可能导致这个问题的设备。 我们使用Portfast和BPDUGuard启用STP。 问题; 有什么好的方法来解决这类问题? Cisco IOS中有哪些好的机制可以阻止路由器宣传stream氓路由 谢谢!
我们的部门是基于nix的,但不幸的是,我们所属的公司是在Windows环境下运行,直到我为自己的服务器获得预算,我必须在Hyper-V环境下运行我们的服务器。 我在Wheezy虚拟机上遇到了大量的networking问题。 自从进行安装之后,在执行apt-get update或apt-get install <package>时,会出现随机问题来parsing主机名,我必须在成功完成前多次重复该过程。 root@gitlab:/home/git/gitlab# apt-get update Err http://debian.mirror.ac.za wheezy Release.gpg Something wicked happened resolving 'debian.mirror.ac.za:http' (-5 – No address associated with hostname) Hit http://security.debian.org wheezy/updates Release.gpg Hit http://packages.dotdeb.org wheezy Release.gpg Hit http://security.debian.org wheezy/updates Release Hit http://packages.dotdeb.org wheezy Release Hit http://security.debian.org wheezy/updates/main Sources Err http://debian.mirror.ac.za wheezy-updates Release.gpg Something wicked happened resolving 'debian.mirror.ac.za:http' (-5 […]
我们有一个networkingdevise如下所示。 现在我担心,如果额外的交换机正在影响我们的networking吞吐量或延迟或造成任何networking冲突。 如果我从第一个36端口开关直接运行21行? 这样做会有什么好处吗? Router | Switch (36 ports unmanaged) | | | | (4 different offices – each office 4 to 7 computers) Switch1 | switch2 | switch3 | switch4 (all unmanaged) | | 6 pc | 4 pc | 7 pc | 4
我想知道为什么我的LDAP无法login(ssh,sudo或su – ),或者我的networking中断了。 如何重现该问题: – 只需将您的DNS更改为无效(例如:nameserver 100.0.2.2) – 尝试login(su – )或ssh / var / log / secure说: Feb 26 18:45:39 vmcentos5 sshd[6311]: Accepted password for root from 10.0.2.2 port 59717 ssh2 Feb 26 18:46:19 vmcentos5 sshd[6311]: nss-ldap: do_open: do_start_tls failed:stat=-1 Feb 26 18:46:59 vmcentos5 sshd[6311]: nss-ldap: do_open: do_start_tls failed:stat=-1 Feb 26 18:46:59 vmcentos5 sshd[6311]: nss_ldap: […]
我们有一个服务器可以导出两个分区,一个是61TB,另一个是28TB,而另一台机器上有很多用户正在读写这些分区。 我们有单独的用户抱怨这些坐骑自动卸载和重新安装,这会破坏像MATLAB工作正在进行的东西。 我问人们抱怨给我一个时间框架,同时已经设置好了在过去的几个小时内运行nicstat -i eth0 3 (每三秒钟检查一次网卡的使用情况),并打算让它继续运行。 我将结果写入日志中,以便我可以检查它们,并希望在意外/不受欢迎的卸载发生时与它们进行交叉引用。 用户还没有回到我身边。 基本上我在很长一段时间内快速浏览了nicstat的结果,有两件事对我很重要,但我不确定它们是否可以被认为是正常的。 每隔两个小时左右,活动就会突然减less : Time Int rKB/s wKB/s rPk/s wPk/s rAvs wAvs %Util Sat 21:13:04 eth0 48057.5 30790.5 35560.6 23086.0 1383.9 1365.7 64.6 0.00 21:13:07 eth0 5438.7 12064.3 4697.4 8237.9 1185.6 1499.6 14.3 0.00 21:13:10 eth0 2.98 0.09 8.67 1.33 351.7 66.00 0.00 0.00 21:13:13 eth0 0.87 […]
我试图build立MIPS Linux盒子networking。 这是它的configuration: ~ # ifconfig eth0 Link encap:Ethernet HWaddr CC:5D:4E:FF:45:7F inet addr:192.168.0.2 Bcast:192.168.0.255 Mask:255.255.255.0 inet6 addr: fe80::ce5d:4eff:feff:2178/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:1333 errors:0 dropped:10 overruns:0 frame:0 TX packets:573 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:107853 (105.3 KiB) TX bytes:45385 (44.3 KiB) Interrupt:5 lo Link encap:Local Loopback inet addr:127.0.0.1 Mask:255.0.0.0 […]
RA消息具有AdvManagedFlag。 如果此标志为ON,则主机“应使用有状态自动configuration来获取地址”(RFC 2462)。 但RA消息正在被内核处理。 我们如何知道这个标志已经到来,主机需要运行dhcpv6-client? 它提供了吗? 我理解这个build议吗? 在IPv6支持的各种实现(例如一些路由器)中,我只看到了直接模式select(DHCPv6或SLAAC),而我没有看到基于RA的标志的dynamic模式select。 又一次:有可能吗? 我理解这个build议吗? 希望你的帮助。