DWORD同步丢失如何影响SAS磁盘的运行状况?

我尝试通过运行以下打印SAS(SSP)协议特定日志页面的值和说明的命令,从SAS磁盘的错误日志中获取更多信息。

# smartctl -d scsi -l sasphy /dev/sg1 Protocol Specific port log page for SAS SSP relative target port id = 1 generation code = 79 number of phys = 1 phy identifier = 0 attached device type: end device attached reason: power on reason: loss of dword synchronization <======================== (?) negotiated logical link rate: phy enabled; 6 Gbps attached initiator port: ssp=1 stp=1 smp=1 attached target port: ssp=0 stp=0 smp=0 SAS address = 0x5000... attached SAS address = 0x5b8... attached phy identifier = 6 Invalid DWORD count = 0 Running disparity error count = 0 Loss of DWORD synchronization = 24194 <======================== (?) Phy reset problem = 0 ... relative target port id = 2 generation code = 79 number of phys = 1 phy identifier = 1 attached device type: no device attached attached reason: unknown reason: unknown negotiated logical link rate: phy enabled; 1.5 Gbps attached initiator port: ssp=0 stp=0 smp=0 attached target port: ssp=0 stp=0 smp=0 attached SAS address = 0x0 attached phy identifier = 0 ... 

从上面我注意到,DWORD同步有很高的损失, 根据IBM的说法,当一个PHY停止检测到一个DWORDinputstream时发生错误。 我试图search有关此错误的更多信息,但似乎无法find任何。

DWORD同步丢失如何影响SAS磁盘的运行状况? 我需要担心吗? 我应该在什么样的门槛水平上进行监控?

此错误不会影响驱动器本身的健康状况。 如果您将驱动器移动到另一个没有链接问题的机箱,驱动器将会正常工作。 这是假设链接问题不是源于驱动器端口本身。

这些错误意味着驱动器和上游端口之间的连接有问题,如果你有一个电缆在那里电缆可能是坏的,如果不是这意味着一个端口是坏的。 当然,即使你有电缆,它仍然可能意味着其中一个端口是坏的。

诊断它的方法是在同一插槽中使用不同的磁盘,查看错误是否消失,如果消失,则说明磁盘损坏。 如果错误仍然存​​在,那么原始磁盘没问题,但是服务器/机箱上的端口坏了,需要更换服务器/机箱。

dword同步丢失的问题是,这意味着对于一些发送的IO来说,额外的重试,并且由于这些重新发送而等待更多的数据传输,这将增加IO的等待时间。 在严重情况下,任务中止可能会发送,甚至目标重置作为错误恢复的一部分,这将使驱动器无法访问许多秒,并可能导致文件系统失败或突袭丢弃磁盘。