GCE内部networking问题

从昨天下午1:10开始,我们的GCE内部networking在虚拟机之间进行通信时开始偶尔出现networking超时。 这个问题并不是孤立于任何特定的节点 – 与node.js服务器通信的nginx,与kubernetes通信的node.js服务器,与度量服务器通信的各种实例 – 同时开始生产和分段集群(都是在相同的传统VPCnetworking上)。 这导致页面加载失败以及内部应用程序通信中的问题。

我们的分段集群的Stackdriver运行状况检查显示了一些明确的问题,昨天下午1:10开始,同时我们开始在我们的日志中获取networking超时。 我们生产集群的健康检查看起来是一样的。

我们试图重新启动遇到问题的各种虚拟机,但这似乎没有效果。

我在如何诊断或解决这个问题上有点不知所措。 我应该在哪里寻找进一步的调查或可能的解决scheme