驱动器故障服务器 Gind.cn

在SSD（SSD + HDD系统）上放置写密集型分区是否安全？

我正在为Linux上的SW开发工作build立一个强大的工作站。这是一款具有多核，32GB内存，大容量硬盘和120GB SSD（三星MZ7WD120HAFV又名SM843T）的Xeon系统。我必须决定把哪些分区放在硬盘上，哪些放在SSD上。我在这个问题上得到了相互矛盾的build议： “不要把经常写密集的分区放在SSD上，你会缩短它的使用寿命，这可能会在几个月内失败。” （类似于这个答案） “如果你有第二代或者第三代SSD（这意味着任何带有TRIM的驱动器），那么你不必像普通硬盘那样处理它：你可以把写密集的文件，日志和交换放在它上面。（从这个网站上的答案）性能和稳定性对我来说都很重要，尽pipe这不是关键任务服务器。所以我该怎么做？笔记：当然，我会为我的关键数据提供一些备份scheme，但问题不在于此。

了解Synology 1812+设备的SMART值

我有一台Synology 1812+ NAS，配有8个3TB硬盘，configuration为RAID 5，运行DSM 4.1。它被用来replaceUSB驱动器，使用Time Machine整合存储和短期OS X备份。该设备和驱动器只有2个月大。隔两周，我开始从两个驱动器获得IO错误。日志有以下错误： Read error at internal disk [3] sector 2586312968. 之后 Bad sector at md2 disk3 sector 250049936 has been corrected. 这些部门从来不匹配。 build议在驱动器上运行扩展SMARTtesting。我做了，这是我得到的价值观：然后，我对其中一个没有收到投诉的驱动器进行扩展的SMARTtesting，这里是我得到的值：值看起来非常相似。我不清楚是否存在问题，如果不存在，如果SMARTtesting没有发现任何实际问题，那么SMARTtesting有什么意义？我应该如何解读这些结果，何时应该知道更换硬盘的时间？

sda1（？）raid在debian上失败 – 现在该怎么办？

ispconfig说我的服务器有突袭问题。服务器不是我的，它是从托pipe公司租用的。操作系统安装不是我的业务：托pipe公司做到了。 cat /proc/mdstat Personalities : [raid1] md0 : active raid1 sda1[2](F) sdb1[1] 312568576 blocks [2/1] [_U] 我真的不熟悉这个问题，我从未遇到这样的问题。我想sda1已经死了。你能帮我现在做什么（除了我应该打电话给托pipe公司）吗？我有一切重要的备份。

SMART – 预测故障计数

我正在使用MegaCLI来监视IBM ServeRAID M5015控制器的RAID状态，我在磁盘上有一个这样的： Enclosure Device ID: 252 Slot Number: 6 Enclosure position: 0 Device Id: 14 Sequence Number: 2 Media Error Count: 32 Other Error Count: 0 Predictive Failure Count: 18 Last Predictive Failure Event Seq Number: 8119 PD Type: SAS Raw Size: 279.396 GB [0x22ecb25c Sectors] Non Coerced Size: 278.896 GB [0x22dcb25c Sectors] Coerced […]

服务器硬盘和固态硬盘的年龄replace政策

我正在为我们的存储和服务器制定一个年龄替代政策。他们大多数是数据库和一些图像（静态内容）所以是的，他们有一个巨大的I / O每次。另外，我们使用三星840 Pro SSD作为CacheCade作为RAID控制器（PERC H700i）。你们是否正在pipe理旧硬盘和固态硬盘的更换？

惠普Proliant ML350 G5 SAS硬盘

我在HP Proliant ML350 G5中遇到问题。几天后，其中一个SAS硬盘出现故障。这是146GB SAS 15krpm硬盘。我们得到了一个新的146GB SAS 10k rpm硬盘。它在RAID 1（1 + 0）configuration。我们更换了SAS硬盘，但没有重build。我们得到消息，当重新启动服务器做自动服务器恢复，我们按F2。它开始恢复，但在20％（惠普系统pipe理）后，停止，没有任何事情发生。它显示逻辑驱动器退化。而且在ACU，它显示准备重build。我们试了2-3次，但还是一样的。每当我们重新启动它时，继续说自动服务器恢复。任何build议，如何解决这个问题？

ZFS报告（在FreeBSD和Linux上通过ZoL）

由于长期使用mdadm的用户刚刚遇到磁盘错误，并且记得我为磁盘错误configuration了mdadm的自动邮件报告。因此，我只需要在/etc/mdadm/mdadm.conf中插入我的邮件地址 MAILADDR [email protected] 但是我真的错过了FreeBSD上的那一个。而且就像我的ZFS RAID6现在运行了半年以上，我想如果磁盘遇到故障会发生什么？我从来没有configuration任何外部邮件地址。有没有简单的方法来完成和testing呢？像在mdadm上一样： sudo mdadm –monitor –scan –test 而我将如何在Linux上使用ZoL（Linux上的ZFS）呢？编辑：对不起，我的意思是自动报告。没有预定。我知道我可以build立一个脚本并且每分钟parsingzpool状态-X。但我认为这不是完成报告问题的非常优雅的方法。最好立即通知磁盘故障（如mdadm）编辑[2]：感谢您的build议，但没有我卡住了一些脚本问题，有人可以帮我在/ bin / sh我的循环问题在这里 – > PASTEBIN 编辑[3]：得到我的循环问题。 :)（更新在PASTEBIN ）还有什么更多的build议为我的脚本？

RAID 1真的能防止硬盘故障吗？

如果使用RAID 1，并且发现两个磁盘之间存在任何不一致，则将数据从主磁盘（最有可能是具有较低端口号的磁盘）复制到辅助磁盘。 1）但是，如果主磁盘已损坏，并且因此两个磁盘之间的数据差异仅仅是由于主磁盘中的硬件故障而存在？然后将错误的数据同步到辅助磁盘？是否有现代硬盘驱动器的校验和，以确保这样的事情不会发生？ 2）如果我从2个USB-Sticks创build一个RAID 1？ USB-Sticks上有什么机制来检测读取问题，这样损坏的数据不会被RAID同步到另一个USB-Stick，甚至可能覆盖正确的数据？ USB-Sticks（针对embedded式系统）的RAID 1是否有意义，或者由于写入耐久性有限，可能会在同一时间失效？

更换HP Smart Array E200i，不会丢失数据

我有一个Smart Array 200i，它似乎有一些坏插槽（插槽3和插槽5）。不pipe我在这些插槽中放置什么高清，它总是告诉我驱动器是坏的。我的问题是双重的：这可能只是我做错了吗？我的印象是，你所要做的就是把坏的驱动器拿出来装进新的。我错了吗？如果插槽确实坏了，我可以更换整个控制器（其中包含操作系统的启动驱动器在RAID 5），而不会失去交换后访问该驱动器的数据？在一个稍微分离的问题上，这个智能arrays有两个SATAarrays，一个是操作系统，一个是我认为不再使用的arrays。我想删除第二个arrays，并使用第一个arrays插槽，如果该插槽真的不好，但我不知道如何100％确定它没有被用于其中一个逻辑驱动器。下面我已经说明了最好的，我可以configuration显示在arraysconfiguration实用程序，我将尝试在这里布局文本forms的configuration（我的名声不够高，我不能发布图像）： Smart array E200i in embedded slot SATA Array A [+] Logical Drive 1 (953816 MB, RAID5) [ ] Unused Space, ??? SATA Array B [X] Logical Drive 2 (1907675 MB, RAID 5) – Failed [ ] Unused Space, ??? 更新：来自hpacucli的回复： Smart […]

URE究竟是什么？

我最近一直在研究RAID5 Vs RAID6，并且由于URE额定值和驱动器尺寸的增加，我一直看到RAID5不够安全。基本上，我发现的大部分内容都表示，在RAID5中，如果磁盘发生故障，如果arrays的其余部分是12TB，则几乎有100％的机会遇到URE并丢失数据。 12TB的数据来自这样一个事实，即磁盘读取10 ^ 14位的数据以达到一个URE。那么，我不能到这里。阅读是由头部进行的部门完成的，可以使阅读失败的是头部死亡或部门死亡。也可能是由于某种其他原因，阅读不起作用（我不知道，就像一个震动头部跳跃…）。所以，让我解决所有三种情况：阅读不起作用：这不是不可恢复的，对吗？它可以再试一次。头部死亡：这肯定是无法恢复的，但是，这也意味着整个拼盘（或者至less是侧面）将是不可读的，这将是更惊人的，不是？该部门的死亡：也完全无法恢复，但在这里我不明白为什么4TB磁盘的额定值为10 ^ 14的URE和8TB的额定值为10 ^ 14的URE，这将意味着8TB（很可能是新技术）的可靠性与4TB的一样可靠，这是没有意义的。如你所见，从我认定的3个失败点来看，没有任何意义。那么URE究竟是什么，具体是指？有人可以向我解释吗？编辑1 在第一波答案之后，似乎是这个部门失败的原因。好的是，固件，RAID控制器和OS +文件系统已经有程序来及早检测和重新分配扇区。那么，我现在知道什么是URE（实际上，这个名字是不言而喻的:)）。我仍然困惑于潜在的原因，主要是他们给出的稳定的评级。有些人把失败的部门归因于外部的来源（宇宙波），然后我感到惊讶的是，URE的速度是基于读数，而不是年龄，宇宙波确实会影响更老的磁盘，因为它已经暴露更多的，我认为这更像是一种幻想，虽然我可能是错的。现在是另一个与磁盘磨损相关的原因，有人指出，密度越高，磁畴越弱，这是完全合理的，我会按照解释。但是，正如这里很好地解释的那样，较新的磁盘不同的大小主要通过在HDD机箱中放置或多或less的相同的盘片（然后相同的密度）来获得。这些扇区是相同的，都应该有相同的可靠性，所以更大的磁盘应该比较小的磁盘有更高的评价，扇区读取更less，这是不是这样，为什么？这可以解释为什么新技术的新硬盘比旧硬盘没有更好的等级，仅仅是因为更高的技术收益被更高密度的损失所取代。

Intereting Posts

CentOS 7 DHCP服务器启动失败（在指定的端口上不启用）通过互联网连接三台服务器活网站已closures。 stream量太大。我从哪说起呢。（Win 2003 + ASP.NET + Memcached + SQL Server 2005） SQL * Loader安装监视许多远程计算机的健康（SMART数据，温度等）用户无法在WS2012R2域上更改密码如何修改只有一个参数的modsecurity规则动作？删除窗口serveur 2008上的VPN服务器，现在我无法ping服务器 AWS VPC Private vs公有子网集群Apache 2.4 LoadBalancer在/ balancer-manager上不显示任何内容使用iptables桥接DNATedstream量如何从Azure存储资源pipe理器中删除旧会话？用于“ssh tail -f”风格日志文件监控和分析的最佳工具命令的完整path 使用Nautilus通过双重SSH隧道访问远程服务器

Articles of 驱动器故障