如何监视和测量用作服务器存储的Compact Flash卡的健康状况?

上下文

该公司出售一种收银机networking应用程序。 通过VPN提供对应用程序的访问。 客户端的VPN入口点是运行Voyage Linux(Debian的精简版)的Soekris板。 这些主板已经运行了3年的MySQL,具有复制和RoR应用程序堆栈。

这些主板的存储支持是Compact Flash 4GB卡。

问题

我们正在这些板上发生常规错误和随机应用程序崩溃。 最常见的错误如下:

Aug 24 14:54:44 box45 puppetd ​​[3669]:无法运行Puppet :: Network :: Client :: Master:过时的NFS文件句柄 – /var/lib/puppet/state/state.yaml

8月24日13:37:01 box76内核:[2091.575622] EXT2-fs错误(设备hda1):read_block_bitmap:无法读取块位图 – block_group = 30,block_bitmap = 983040

如果这些是基于HDD的,我将运行SMART监视工具来检查坏扇区和一般磁盘健康状况。 除了因为是CF卡,我处于黑暗中,难以衡量情况有多糟糕(或好)。

我能做些什么来监控这些卡片的健康状况并衡量他们的健康状况? 我坚持“措施”,因为我需要给出一些事实,最终将激发所有CF卡的变化。

而为了让事情更复杂一点,我没有物理访问Soekris板,所以这一切都需要遥远。

这个错误似乎很明显地指出了CF卡介质的问题。 如果已经运行了一段时间没有任何问题,现在是给这些问题,我认为卡已经开始坏了。 最简单的testing方法是使用replace卡发送技术,然后将其交换出去,特别是在有限数量的系统上看到这种情况。 所有媒体都有寿命和失败率; 读取/写入的周期越多,卡片越早死亡。

还有一件事要看:每次在同一个地点附近阅读的错误是什么? 这会告诉我,这可能是一个坏的细胞以及在卡的特定部分。

我不知道fsck是否会在这些卡上以相同的方式工作。 看到这个错误的第一个倾向是取代它。

为什么在世界上你会从CF卡上运行东西? 如果您需要闪存,请使用固态介质(用于此目的)。 CF卡不是用技术标准制作的,包括监控。 你可以做的最多的是检查磁盘并检查坏扇区。