远程桌面服务器场停止工作

一个以前很好运作的远程桌面服务器农场啊两天前停止工作。 设置如下:

  • DNS将“myfarm.mydomain.local”parsing为所有场成员服务器的IP
  • 所有服务器场成员服务器均在代理MYBROKER上configuration为服务器场“myfarm”的服务器场成员
  • 所有农场成员都是MYBROKER上本地会话代理组的成员
  • 客户端被configuration为连接到“myfarm”

(所涉及的所有服务器都是虚拟的Windows2008R2盒)。 突然间,人们开始出现以下错误(由德语翻译),无法连接。

无法连接到terminal服务器。

您尝试连接的terminal服务器场“myfarm”将您redirect到服务器“farmmemberX.mydomain.local”。 远程桌面无法validation此服务器是否属于同一个服务器场。 如果您的networking上有与服务器场名称相同的服务器,则会发生这种情况。 ?如果两台远程计算机都属于同一个远程桌面服务器场,则无法validation。 如果要build立到远程桌面服务器场的连接,则必须使用服务器场名称,而不是计算机名称。

如果您使用由pipe理员准备的RDP连接,请联系networkingpipe理员以获得支持。

如果要连接特定的服务器场成员,请使用“mstsc / admin”

有时候,他们似乎也被拒绝了,就好像input了错误的证书(他们没有,大多数已经保存了证书)

问题1.你能解释一下这个背后的问题,特别是关于“不能被validation”的问题:如果validation是有效的,这个validation是如何进行的? 毕竟,如果不是由经纪人发起的话,redirect甚至是不可能的。

我们尝试过的:有时它有助于用别的东西来replace客户端连接的名字(例如,我们给DNS添加了名称“foo”,parsing为相同的IP并且用户连接到“foo”),但是这远远不够从一贯。

后来我们注意到在上面的错误信息中总是有相同的几台服务器出现在“farmmemberX”中。 我们通过实验从服务器场(成员本身和DNS)中删除了这些服务器场,从而能够将破损的八服务器场减less到function齐全的服务器场。 由于这不足以阻止用户负载,我想克隆其中的一个; 为了做到这一点,我首先closures它,之后重新启动它 – 从那一刻起,它和其他六台服务器一样糟糕。 显然重新启动RDP服务器是致命的事情…根据日志,这个特定的服务器已经有两个月没有重新启动。 因此,在过去两个月中所做的任何改变都可能是相关的。 这些之中

  • 我们将我们的第一个Win2012 AD服务器添加到我们的Win2003 AD结构中
  • 我记得有一些IE10 / SSL / TLS相关的安全问题,需要人工干预(registry和东西)的情况下,但我仍然试图记住这些可能是
  • 吨的Windows更新
  • 诸如无效证书之类的东西来到我的身边,但是我没有发现这样的事情

问题2.这些事情中的任何一个都可能导致这个问题

目前,我们完全放弃了服务器农场,也就是说,我们只通过DNS循环来实现“穷人负载均衡”(当然,我们特别错过了重新连接到上一个会话的特性)

主要问题。 我怎样才能让我的农场再次进入工作状态?


编辑:我应该提到,有几个客户是幸运的,并没有与RDP农场peoblems:那些谁仍然运行Windows XP和旧的RDP客户端…


编辑后评论:似乎主要责备更新KB3002657,KB3035017要么没有安装,要么已经安装了相关的服务器(客户端,RDP服务器,经纪人,数据中心)的问题开始前几天安装,但我会尝试与卸载他们呢


更新一些更多的信息:

  • 我增强了经纪人的事件logging。 根据该日志,一切正常(没有警告),会话redirect正常完成。 只是在soe超时之后,目标会话被删除。 我在快速连接中尝试(失败),在这种情况下,代理甚至logging它试图重用现有的会话。
  • 如果目标RDP服务器设置为“RDP-Sercurity”而不是“协商”,则redirect工作(除了客户端发生可预期的烦人错误消息)
  • 我尝试了一个全新的农场(也就是与不同主机不同的经纪人),这个问题也可以在这个系统中重现。 这可能表明问题是客户端。

按照每个评论的要求更新信息

如果我在RDP主机上设置安全性为“TLS 1.0”(而不是“协商”),问题依然存在。 如果我设置为“RDP”,农场就可以工作 – 但是每个人都必须input两次密码。 在错误的情况下,出于某种原因,我现在经常只是得到“没有连接可以build立与给定的凭据”,而不是原来的错误。 这伴随着一个login失败事件4625,状态为0xc000006d,为零。在问你之前:所有DC的时钟都处于良好的同步状态; 在registry中没有configurationLanMan兼容性设置。

RDP主机客户端设置上的证书由仍值得信赖的内部CA(每个GPO都信任)颁发,并且至less在未来至less四个月内有效。 为了进行testing,我将这些文件作为“自动”证书返回,但没有成功。

原始的德语错误消息文本读取

Von Remotedesktopverbindung kann keine Verbindung mit dem Remotecomputer hergestellt werden。

Vom远程计算机“FARMNAME”,远程计算机“FARMMEMBER.DOMAIN”umgeleitet。 Es kann nichtüberprüftwerden,ob diebeiden Remotecomputer zur gleichen Remotedesktop-Sitzungshostserverfarmgehören。 Siemüssenden Farmnamen,nicht den COmputernamen,verwenden,wenn Sie eine Verbindung mit einer Remotedesktop-Sitzungshostserverfarm herstellenmöchten。

Wenden Sie sich an den Netzwerkadministrator,umUnterstützungzu erhalten,wenn Sie eine RDP-Verbindung verwenden,die vom Administrator bereitgestellt wurde。

Wenn Sie eine Verbindung mit einem bestimmten Fammitglied herstellenmöchten,um es zu verwalten,geben Sie“mstsc.exe / admin”an der Eingabeaufforderung ein。

为了弄清楚一些最近的更新是否有缺陷,我开始使用新的Windows 7盒子,并在每一次更新之后进行testing。 似乎第一个比XP更好的客户端已经引起了问题 – 但是第一个这样的客户端版本给出了一个不同的错误信息(不是有意义的):

Die Verbindung kann nicht hergestellt werden,da es sich bei dem erreichten Remotecomputer nicht um den angegebenen Computer handelt。 死亡的DNS模块cachingverursacht werden模块。 Verwenden Sie statt des Namens死IP-Adresse es Computers。

在这里find大海捞针似乎相当困难,但我认为这是一个configuration错误的地方。 在此之后应该给你一个工作基准configuration:

  1. 在DNS区域中为<farmname.domain> <domain>创buildA-RR,指向场中的每个会话主机
  2. 为每个<sessionhost.domain>设置受信任证书,其中的主题备用名称为<farmname.domain>并在每个会话主机上为RD服务安装/启用它们
  3. <connectionbroker.domain>pipe理模板/ Windows组件/远程桌面服务/远程桌面会话主机/ RD连接代理中的所有设置)中设置将所有会话主机configuration为<farmname>场成员的GPO: 在这里输入图像说明
  4. 设置GPO,将连接代理的计算机帐户分配为Distributed COM Users (built-in)
  5. 重新启动会话主机以确保所有策略都已应用且有效
  6. testing客户端连接到<farmname.domain>

祝你好运!

感谢所有的build议,但他们匹配。 我不知道为什么观察和描述的故障模式(和故障的时间发展)发生,但罪魁祸首隐藏在我所描述的

  • 吨的Windows更新

这是KB3002567。 这个更新在发布之后不久就被称为“破解RDP” – 或者实际上破坏了一切 。 具有讽刺意味的是,在第一次遇到问题之后进行了一个快速的研究,已经揭示了这个问题(至lessRDP问题,因为这是我们search的),所以我们标记了KB3002567(和其他一些可疑的问题)参见我在OP中对此的乐观评论)以及暂时冻结的更新同步。 我们没有注意到的是这个更新的Windows Server 2003版本认为自己是不可卸载的。 因此,虽然我们在testing更新期间注意到了修补程序如何从Win2008服务器成功移除,但我们认为在我们的AD服务器(Win 2003)上也成功移除了这个移除过程(因为他们不需要任何更新) , 下一天)。 由于问题依然存在,我们认为更新问题毕竟不是问题(事实上rdp并没有完全被打破 – 我们设法以牺牲用户的舒适度为代价来解决问题)。 另一方面,Win 2012版本可以自动卸载。 因此,它依赖于哪个服务器用于authenticationRDP是工作还是不工作。 我们错误地得出结论,服务器重新启动使以前“安装”的问题出现 – 实际上重新启动只是切换authentication服务器的优先顺序。 我们也错误地得出结论,我们的AD迁移testing是问题的原因,降级和删除2012年的服务器,然后开始寻找这个玩AD的任何问题可能有。 既然这个问题反正越来越严重,当我们注意到在我们摆脱了2012 AD服务器的同一天(虽然事后明了),我们并没有太多的疑虑。

当我们的search不断提出相同的无用的build议(检查服务器之间的时间差小于5分钟 – 检查,这只是几秒钟;检查所有相关的组成员设置 – 这真的是无聊的时候做一秒钟时间;检查DNS条目 – 在DNS中确实很less发现错误,检查KB3002567没有安装 – 嘿,我们的WSUS照顾了,不是吗?)我们开始撕掉我们的头发。 当出现另一个提示KB3002567的提示时,我们终于扫描了我们的Win2003 AD服务器上安装的更新列表(哎呀,现在的操作系统真的变得更简单了),竟然还是发现它已经安装了。 手动卸载,重启,大家马上开心