Windows Server 2012 R2,iSCSI目标服务器80无盘客户端,挂起故障挂起和什么

我咬的方式比我嚼的还多。

最近购买了一台80无盘PC互联网/游戏咖啡厅。 运行系统被破解了CCBoot,最初似乎造成了随机挂起,这显然没有破解CCBoot的错误,尽pipe他们声称破解许可导致随机蓝屏。

我需要指导和一般提示设置Windows Server 2012 R2,iSCSI目标服务器以启动和运行80个无盘PC

经过3个不眠之夜+ 7天的全面监控和重新configuration,linux服务器,与gPXE ||搞混了 iPXE,学习它的脚本,大量的谷歌search,DHCP服务器configuration,从网上零零碎碎,神知道有多less新鲜的格式安装的Ubuntu,Windows Server 2008,Windows Server 2012,Windows Server 2012 R2结合当前规格如下:

眼镜

软件

服务器:

  • Windows Server 2012 R2
  • iSCSI目标服务器
  • 1父VHDx
  • 80孩子差异VHDx的
  • 每个VHDx有80个iSCSI目标
  • MPIOfunction/检查的iSCSIcheckbox/
  • DHCP服务器angular色
  • Hyper-Vangular色/没有虚拟以太网适配器设置/
  • SolarWinds TFTP服务器
  • iPXE自定义脚本图像

客户:

  • Windows 7 x32 /不是sysprep-ed /
  • 1gbpsbuild立局域网
  • 几场比赛

iSCSI设置:

  • 1个主VHDx
  • 4个父级差异VHDx由安装在4个不同HW硬件PC上的主引导和自动驱动程序产生
  • 80个孩子区分VHDx是由4位父母产生的
  • 硕士和4位家长位于SSD
  • 所有位于软RAID /存储池/卷上的孩子

技术

服务器:

  • 1x120GB SSD
  • 1x500GB SSD
  • 3x500GB硬盘/存储汇集到1.36 TB软RAID0 /
  • 1gpbs网卡
  • i7 4770

客户:

  • 1gbps局域网卡/不知道是否有10gpbs /
  • 2或3个不同的供应商,但相同的GPU和型号的video卡,nVidia GTS 450
  • AsRock P55M Pro
  • 2x 2048MB三星RAM

networking:

  • 1gbps工作连接
  • 1x Cisco路由器/ 100mbps LAN端口,仅用于WAN接入/
  • 一个DVR系统
  • 3z DGS-1024D级联交换机

设置这个设置的软件方面,有一些软件工程背景,足够令人尴尬,花了我3天。

目前的问题:

  • 个人电脑只是完全冻结,但很less启动
  • 运行PC的随机冻结,需要硬重置,假设在客户端的硬件问题,没有检查或隔离。 假设原因:以前的CCBoot设置存在问题。
  • 整个系统只有10个人同时坐在10台客户机上进行testing,一半以上完全closures,所有问题都出现在运行客户端。

问题:

  • DVR系统会影响networking吗?
  • Windows 7是否比Windows XP有更多的磁盘I / O请求? 如果是这样,我更愿意在主VHDx上切换WinXP。
  • iSCSI目标服务器调整必要的
  • 有没有一个特别的关键字来select这个networking的交换机,我相信DGS-1024D丢失了很多的数据包。

我只设置了testing子VHDx,编写了一个脚本来删除,生成和连接子VHDx的目标,并在最后一天终于在客户端PC上运行,我希望系统能够正常工作,因为所有其他我花费的时间是设置服务器和configurationDHCP和iPXE,当然格式。 我的每一步都需要为服务器PC提供不同的操作系统。 所有这一切记住,只有1个SATA DVD-ROM和1个4GB闪存盘。

一般来说请拍我,嚼我,只要你给我正确的提示。 非常绝望。

更新:为不同的硬件设备准备不同的映像后,启动已成为正常。 最近,build立networking的人和负责广域网的人来了重置路由器,当我问为什么有一条连接到服务器networking的局域网线路“消失”时,也重新连接了服务器到路由器,某处而不是连接到附近的交换机或至less路由器本身/最接近的服务器/他不知道。 那是2或3天前,通过任务pipe理器和通常监视,我发现路由器不是1Gbps! 重新连接服务器使用老式的1gbps连接,显然是在级联交换机的另一端,固定的蓝屏/这是几个小时前,我没有真正强调整个系统,只能同时运行10个电脑/ 10台电脑的运行1经历了一个冻结或蓝屏,我现在的假设是Mobo或RAM或过热导致冻结,明天没有启动任何其他PC /没有networking负载/我要压力testing一台PC最后冻结会再次冻结。 如果是这样,那绝对不是networking,也不是iSCSI的问题。 总而言之,当收到一个有问题的系统问题时,是不要相信任何人,承担任何事情,一切都是错误的,从基础开始。 当然,“如果没有损坏,不要修理”

PS在1点我以为一些个人电脑有内存问题,相信只有几个电脑遇到问题。 所以,我把最有问题的电脑,并从USB上运行一个memtest,当我回来检查时,显示了19000错误和冻结。 我自动假设所有的个人电脑都有内存问题,相信所有的内存都必须检查; 一天后,我拿了一台PC /相信没有硬件问题,并在其上通过了一次memtest。 没有问题,所以我把“问题”的个人电脑的RAM 1 1,并插入这个“testing”电脑,并运行memtest; 令我惊讶的是没有错误! 我很愤怒,同时也迷失了方向。

就在这个时候,我认为以下一个或多个原因是:客户端主板Asrock P55M Pro,过热和GPU不太常见的脏散热器,和/或DGS-1024D交换机/非常值得怀疑。

更新2 。 如果有人正在阅读。 压力testing是否使用FurMark在GPU压力下崩溃,几乎压制了板子。 但不太可能是所有崩溃的原因,因为大多数时候崩溃是随机的,而不是高GPU使用率。 但是因为我几乎把电路板上的砖块弄坏了/局域网引导器不再工作了/我把电脑卸下了,把它插在不同的地方去运行一些testing,看看有多less灰尘积累了,然后运行memtest。 lan引导神奇地固定自己/我想它需要一个完整的权力排水/。 Memtest在100K错误结束失败,所以我跑memtest单独的棍子和testing通过,然后重现失败在两个棍子同时再次通过运行memtest。 这些三星RAM棒上运行的电路板似乎有问题,我相信我把问题缩小到RAM,一旦我能find这些RAM棒的正确configuration/即mhz和电压设置/我可以移动和testing在使用〜10台PC时,100mbps – > 1gbps发现后的iSCSI系统运行良好。

PS远离AsRock和三星RAM,但更多来自AsRock

最后如果我稳定了系统,我一定会写一个指导来build立这个系统。