这里是我的情景:我是一个开发人员,我的办公室里有三台服务器。 我也inheritance了作为服务器pipe理员的工作,明显缺乏服务器pipe理知识和谷歌/ ServerFault作为参考点。 幸运的是,我从来没有真正与机器进行过身体接触,也没有解决任何问题,因为他们一直“刚刚工作”。
所有这三台机器都位于同一个数据机房内,用于以下目的:
Machine1
– 托pipe多个内部应用程序的IIS 8.0
Machine2
– 用于内部应用程序的SQL Server 2008 R2数据存储
Machine3
– Machine3
SQL Server 2008 R2镜像存储库
所有三个连接的外部硬盘驱动器经常完成备份。
我已经被告知所有三个人都需要在同一处所内从一个数据室移动到另一个数据室。 我不会完成硬件的物理移动,这将由一个合格的移动器来处理。
除了完成每个备份之后,我还需要考虑在假设地轻弹电源开关并观察我的世界之前做些什么?
我意识到三个人都在同一个房间里,但是这个问题已经超出了这个范围。
真正有趣的问题,以及问:)
在这个举动之前,你需要检查几件事情,一些简单,一些很难。
电源 – 检查新房间不仅有适量的电源sockets,而且是正确的types – 就像物理连接器types一样,如果当前位置允许每个服务器的不同电源阶段防止单相故障,那么I强烈要求你在新的位置复制。
冷却 – 您需要检查是否不会立即或逐步积聚热量,导致过热和潜在的服务器停机。 您通常可以查看每个服务器可以从制造商网站获取的最大功率(以瓦特为单位)或加热(以英制单位为单位) – 让您的大厦经理知道这一点,并从他们那里得到一份书面确认,说明该地区的制冷将能够应对。
networking – 这是困难的 – 不仅需要在旧地点和新地点之间复制相同数量的端口,而且types,速度和最重要的configuration也是如此。 最后一点就是关键 – 几乎所有的networking端口几乎都是平等的 – 我已经足够大,可以记住那些时间了! 但是现在的端口configuration和networking中任何一个端口所处的位置都是天文数字的,您需要确保您的networking人员将所有东西都复制到新旧相同的地方,并不容易。 如果这一举动出了问题,我会把钱放在networking端口上,而不是完全相同,这种情况一直发生。
“其他连接” – 你知道你的服务器是否有其他连接,而不是电源和networking? 也许他们有共享存储的光纤通道链接,到共享pipe理屏幕的KVM链接 – 如果他们需要复制这些相同的话。
除此之外,您还可以随时带着更具体的问题回到这里,我希望这一举措顺利。
其他答案涵盖了此举的技术方面。 您可能还需要考虑其他一些事情。
确保用户知道他们的应用程序将在移动过程中停止。 您可能需要在非工作时间内安排这一行动,以便尽可能减less受影响的人数。
在启动服务器之后,让有知识的人(或多人)testing应用程序。 让他们做一些健全的检查,以确保应用程序正常工作。
testing结束后,告诉用户移动已完成,让他们知道是否有任何问题。
对于我们的格式来说,要说得太“宽泛”是相当困难的。 您需要检查的最重要的事情是,如果您需要以任何方式重新configuration您的networking,如果他们可以继续使用相同的地址运行。 即使他们可以保持相同的地址,确保他们没有通过DHCPconfiguration和/或validationDHCP服务器将在新的位置可用。
附注:正如你已经说过的,拥有SQL服务器和它的镜像远非理想。 但是,在同一地点备份驱动器非常危险。 您需要在不同的物理位置备份您的备份。
其他答案有很好的移动前的考虑。 但是,你也应该计划如何组织实际的行动。 从Machine3是Machine2的镜像的事实看来,正常运行时间对于SQL Server 2008 R2数据库来说是一个重要的考虑因素。 它是一面镜子的事实为您提供了一个机会。 存在镜像的原因是在主服务器不存在的情况下可用。 这包括由于维护而无法使用,其中包括移动。
制定一个计划:
你应该制定一个书面的计划,如何进行此举。 您可能需要能够将这个计划或部分计划提供给处理部分工作的人员(例如搬运工)。 这个计划应该包括所有的移动前的活动,实际的移动和移动后的行动(例如function的validation)。
移动基础:
此举的更详细的描述:
以下包括使用Machine3来testingMachine1和/或Machine2的连接的两种方法(pathA和B)。 你应该只使用一种方法。 什么方式这样做,或甚至是否使用,取决于问题中未包含的信息(例如,最终机器位置的物理分离,机器的物理尺寸,networking/电源线的长度,相同的扩展的可用性,networking端口configuration的相似性,正常运行时间需求等)。 使用Machine3testing这些连接可能会使Machine2的运行时间更长 ,但对于没有镜像的Machine1尤其如此。 你可以select使用任何一种方法,也可以不使用。
先移动Machine3 。
pathA :(可选):
移动机器2 。
[pathB:如果您在可选步骤#2中testing了与Machine3的所有连接,则不需要]如果现在有Machine3 ,则Machine1将结束:
移动Machine1 。
如果任何服务器的IP将会改变,并且通过DNSparsing连接到SQL框,那么您将需要在移动的同时安排对DNSlogging进行更改。
你应该知道的内部网软件和数据库的事情:
如果您没有获得完全相同的IP,或者如果最终发生在不同的子网上,则需要访问以更改连接到SQL Server的任何应用程序的源代码或configuration文件。 人们可能依赖于无证的直接SQL访问来进行临时报告。
利用您的“灾难恢复”服务器。 在移动生产服务器时切换到它们以处理负载。 使用正确configuration的灾难恢复设备,您可以在一天中间进行移动,而不会看到太多停机时间(最多15分钟)。 由于灾难恢复服务器应该按照与生产服务器相同的方式进行configuration。 如果您没有灾难恢复设备,我强烈build议您获取灾难恢复设备。
想想这样:当你的护卫舰正在调整,用你的面包车来度过一天。
有一件我不认为已经提到的是服务器新家的物理安全性。 之前用过的房间是谁,谁有钥匙? 有足够的安全性(报警系统,照相机等)。
除了其他答案之外的一些考虑:
应用程序是否通过文件或使用Web服务每晚交换数据来链接到其他应用程序? 当应用程序不可用时会有什么后果? 相关的应用程序是否可以处理这个问题呢?还是由于缺乏应用程序的信息而导致错误的结果?
您的用户,公司甚至客户可以接受停机吗? 可能多久?
我认为有一个回滚的计划是一个好主意。 您可以在出现无法快速解决的问题时使用它,例如networking问题。 您可能需要保持移动器可用于硬件的情况下。
您的应用程序是否会导致networkingstream量过高,并且networking是否必须为此做好准备(可能比地址和防火墙问题更不可能是一个问题)? 如果您有实时的应用程序(例如video会议软件),则延迟将非常重要。
如果有的话,服务器必须装入服务器机架。