应用程序池线程在线性增加,没有请求被服务

昨天下午,在一些市场营销工作之后,我们收到了高于平均水平(但绝不是很高)的stream量。

在这个stream量持续一段时间之后,我们被告知我们的一个API(每个请求中至less有一次的微服务)挂了一段时间,然后返回503个响应代码。

这些响应原来是来自Load Balancer,因为它无法从两个(相同的)实例中获得响应。

然后,我们查看了实例中的IIS,发现正在使用的线程数量正在迅速增加,几乎与请求数量(大约10 /秒)一致,没有任何请求获得响应。

我们检查了错误日志(期望看到至less几个超时或其他错误),但没有任何东西可以引导我们朝正确的方向前进,因为根本没有logging相关的错误。

整个社会的奇怪之处在于,这个问题似乎无处不在(虽然交通量增加了),然后所有事情都在几个小时后才开始运作。 这可能意味着我们已经超过了一个阈值,导致IIS在线程中出现奇怪的行为,或者可能是巧合。

问题解决后,它不会在同一个实例上再次出现问题,但问题performance在另一个实例运行不同的微服务稍后的一段时间。

有没有人见过这样的模式? 还是类似的东西?