任何人有任何build议企业networking部署负载testing无线networking的方法? 我们有各种各样的无线最坏情况的支持。 没有人或300人的房间,每个人都有1-3个无线设备,他们想要全部使用它们(可能是一次大的教室) 这些build筑中有许多人想要用他们全新的802.11N笔记本电脑,在玩反恐精英(学生宿舍)的同时,还能播放最新的“我所谓的生活”或“shania twain”专辑。 人们期望从build筑物到build筑物漫游的大型空间,都在大量的非企业802.11networking和其他噪声大都会区域。 所以,我们正在计划购买新一代的802.11networking,我们对现有的供应商感到不满意,所以这将是叉车升级。 有没有什么方法可以模拟上述用例,而不购买800台笔记本电脑,并雇用学生机器人“假装”上网或做作业? 如果我们能够在一个受控制和可重复的环境中做事,那就太棒了。 我知道ixia的testing设备看起来有点像我们想要的,但是没有如何正确地进行testing的专业知识,我不确定我们会做对。 所以,除了这个东西的替代品(或者这些东西随机放置在build筑物周围的东西之外)之外,还有哪些公司出来并进行了整个网站的testing? 另外,假设我有一个带有atheros无线射频的linux / freebsd盒子,是否有任何好的工具可以检查现有的无线stream量,从而分析频谱利用率,数据包重传等等?
我们看到我们的软件在运行Windows 2008虚拟机的客户中performanceexception。 主机是VMWare ESX Server。 我看到的最大的问题是我们的进程下降套接字连接或套接字连接超时。 我们的一些进程通过TCP套接字相互通信。 在某些情况下,我们将套接字连接到远程系统(例如WMI,JDBC)。 我相信虚拟机是资源匮乏的。 我们无法访问ESXpipe理/性能仪表板。 我还了解到,主机虚拟机内的perfmon或任务pipe理器提供的任何数字都不是真正的主机操作系统健康状况指示。 我可以写一个程序,做一堆浮点math,并打印出所需的时间。 然后将这个时间与在不同的虚拟机或真正的Windows机器上获得的时间进行比较。 这种方法足以让我们能够确定根本原因是否确实是虚拟机的性能。 然而,要说服客户是否有一个标准的方法或工具来做到这一点会容易得多。 有一个吗?
堆栈溢出职业是这样的: user -> internet -> our fw -> nginx -> haproxy -> web farm FreeBSD是正在使用的操作系统 此框上没有防火墙或QoS nginx处理我们的SSL终止 haproxy处理负载平衡 nginx / haproxy每种方式都推动大约15 Mbps 在正常的操作过程中,nginx收到HTTP请求,完成它的工作,然后将请求转交给绑定到同一个盒子上的环回地址(127.0.0.1)的haproxy实例。 为了进行一些故障排除,我把haproxy实例移到了nginx运行的同一个接口上。 这会立即为所有请求增加100毫秒的延迟。 这个接口不是一个真正的物理接口,而是一个鲤鱼接口 。 任何人都可以向我解释为什么这是事实吗? 与包队列争用也许? 或者也许loopback总是更快,因为它是“软”? 我在这里错过了一些基本的东西,我希望有人会好好教育我。
我的CentOSnetworking节点(LAMP堆栈)正在经历高CPU使用率,但内存使用率低。 几乎所有的进程都是apache。 我知道我可以添加额外的networking节点,直到我的CPU使用变得合理,但我想有一些快速调整技巧,可以在这里很长的路要走。 CPU在90-100%之间反弹。 Mysql的反弹在5%到45%之间。 其余的由Apache完成。 最佳: top – 21:15:49 up 46 days, 20:39, 4 users, load average: 34.17, 44.62, 51.03 Tasks: 133 total, 32 running, 101 sleeping, 0 stopped, 0 zombie Cpu(s): 90.4%us, 9.6%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.1%st Mem: 8388608k total, 6116448k used, 2272160k free, 84160k buffers Swap: 16777208k total, 68k used, […]
根据http://support.microsoft.com/kb/944884 ,“当通过较慢的networking连接向客户端发送大型响应或大型响应时,所需时间字段的值可能会高于预期值”。 我有一个情况,客户会说:“我在10:03:24发送了一个请求到你的web服务器,花了20秒,为什么?”。 我也可以在IIS日志中看到这一点,但服务器的ASP.NET模块将其logging为100ms,CPU和磁盘计数器为低。 我怀疑这是由于networking连接速度缓慢。 我怎样才能certificate这一点? 更新: 1)这些是SOAP Web服务请求,因此没有embedded的graphics,只有一个带有单个XML页面结果的HTTP POST。 2)另外,我已经通过在客户端节制networking速度来再现这一点,症状也完全一样。 3)问题是间歇性的,这意味着对于客户端而言相同的请求通常是快速的,但是偶尔会很慢。 除了通过限制networking之外,我不能再现这个。 服务器的ASP.NET日志logging显示它总是很快,但是当客户端说速度很慢时,IIS日志logging显示它很慢。 4)我只能访问服务器,并且需要向客户端提供尽可能多的信息,以便他们接受问题不在服务器上,并知道在客户端上运行什么日志/工具来查找根本原因。
我试图通过Linux机器之间的“高延迟networking”来提高TCP吞吐量。 我将tcp_mem , tcp_wmem和tcp_rmem为“8192 7061504 7061504”。 我将rmem_max , wmem_max , rmem_default和wmem_default为“7061504”。 我将netdev_max_backlog和txqueuelen设置为10000。 我将tcp_congestion_control设置为“可伸缩”。 我使用“nist”(cnistnet)来模拟100ms的延迟,BW I达到200mbps(没有延迟,达到约790mbps)。 我使用iperf来执行testing和TCPTrace来分析结果,这里是我得到的: 在接收端: 最高胜利:5294720字节 avg win adv:5273959字节 袋发送:0 在发件人方面: 实际数据字节:3085179704 rexmt数据字节:9018144 最大owin:5294577字节 avg owin:3317125字节 RTT最小值:19.2毫秒 RTT最大值:218.2毫秒 RTT avg:98.0 ms 为什么我只能达到200Mbps? 我怀疑“owin”与它有关,但我不确定(这些结果是2分钟的testing,1分钟的testing有1552900的“平均owin”)… 即使延迟为100ms,我预计吞吐量将近790mbps是错误的吗? (我尝试在窗口configuration中使用更大的数字,但似乎没有效果)
性能方面,Intel Xeon i7处理器的L3caching大小对于虚拟化function来说有多重要? 我正在挑选一台至强1366 Nehalem / Westmere CPU作为服务器,我正在试图成为大约4-5个虚拟机的低端虚拟化主机。 4MB L3 Cache和8MB L3 Cache之间似乎有一个价格差距。 多less性能,我会提高到8MB与4MB?
我很难过,我希望别人会认识到这个问题的症状。 硬件:新戴尔T110 II,双核奔腾G850 2.9 GHz,板载SATA控制器,一个新的500 GB 7200 RPM有线硬盘驱动器内的盒子,其他驱动器内,但尚未安装。 没有RAID。 软件:在VMware ESXi 5.5.0(build 1746018)+ vSphere Client下新增CentOS 6.5虚拟机。 2.5 GB的RAM分配。 该磁盘是CentOS提供的设置方式,即作为LVM卷组内的一个卷,除了我跳过单独的/ home并且只有/和/ boot。 CentOS补丁,ESXi补丁,虚拟机中安装的最新VMware工具。 系统上没有用户,没有服务正在运行,磁盘上没有文件,但操作系统安装。 我正在通过vSphere Client中的VM虚拟控制台与VM进行交互。 在进一步之前,我想检查一下我是否合理地configuration了一些东西。 我在VM的shell中以root身份运行以下命令: for i in 1 2 3 4 5 6 7 8 9 10; do dd if=/dev/zero of=/test.img bs=8k count=256k conv=fdatasync done 也就是说,只要重复执行10次dd命令,就会导致每次打印传输速率。 结果令人不安。 它开始好: 262144+0 records in 262144+0 […]
我正在寻找如何发展我们的服务器设置的资源。 我们目前在英国有一个Rackspace专用服务器,规格如下: HPDL385_G2_PrevGen 惠普单核双核皓龙2214(2.2Ghz) 4GB内存 RAID 1中有两个10,000个SCSI驱动器 我们的stream量每月高达550,000 UVs。 该网站运行一个PHP和MySQL的设置。 数据库得到一个绝对的锤击,我们有许多复杂的查询joinmultilpe表。 我们正在使用APC进行PHPcaching。 我已经到了我已经完成尽可能多的DB和查询优化的阶段,并且想知道下一步应该是什么…… 我已经看了memcache,但我有一个印象,他需要大量的内存,理想情况下专用的盒子…. 下一步有两个盒子。 一个用于数据库,一个用于Apache? 还是有一个我忽略了一步。 我们的负荷通常在2分左右,但现在是20点! 来自Munin的一些图表:
好的,我们的新版本在每个服务器上都有100%的CPU峰值,随机间隔。 长时间使网站完全没有响应 – 这将是在不同国家的人login网站等高峰时间。 我们已经看了perfmom,内存分析器,CLR分析器,sql分析器,红门ant分析器,在UAT尝试负载testing – 但甚至不能重现的问题。 这可能意味着只有数以千计的用户击中现场,导致它发生。 我们注意到的一种模式是,新的代码 – 破碎的版本 – 实际上使用的线程less得可怜。 我们也在使用国际奥委会的spring – 这是否有一个名声? 更糟糕的是,由于业务影响,我们无法进行部署,因此无法将问题缩小到我们添加的新function的子集。 我们真的被摧毁 – 有没有人有任何可能拯救我们几条命的战斗伤痕?