Articles of 腐败

用于监控HDD损坏的SMART的替代品

鉴于SMART对于预测硬盘故障是不可靠的 ,有没有人有一个可靠的select来自动快速识别硬盘开始失败? 这是用于Windows Server 2008 R2的。 我没有使用ReFS的奢侈。 我主要关心的是在不知道已损坏的情况下,长时间备份损坏的数据。

不修复“结构需要清理”XFS错误的风险

我有一个文件系统错误影响一些非关键的文件的XFS文件系统。 我想修理它; 企业希望继续与这些错误一起运行。 不修复具有“结构需要清理”错误的XFS文件系统的已知风险是什么? 企业希望避免将需要的可能冗长的维护窗口。 我始终认为文件系统的腐败是不能容忍的。 该业务会问我除了我自己的FUD之外的理由来解决它。 需要什么样的答案 我已经有意见了; 我需要的不仅仅是这些。 答案应该有证据支持(轶事是可以的,但是只有当他们有第一手资料的时候,我们不需要“有人告诉我”的答案)。 专家的意见是可以的,比如来自XFS FAQ的回答,或者来自熟悉XFS内部的开发者的回答。 请不要有庸俗的意见。 我正在寻找证据,可靠的轶事和XFS专家的意见。 否定的答案(例如“在类似的情况下,我跑了一年,没有遇到严重的问题)是可以的。 文件系统的细节。 文件系统是5.4T,使用3.9T(72%)。 有46.6M文件。 错误详情 有55个损坏的目录导致应用程序(如ls和find报告“结构需要清理”,如本XFS FAQ条目中所述 : 问:我看到应用程序返回错误990或“结构需要清理”,出了什么问题? 错误990代表EFSCORRUPTED,这通常意味着XFS检测到文件系统元数据问题,并closures文件系统以防止进一步损坏。 另外,从2006年6月份起,我们从EFSCORRUPTED / 990转换到使用EUCLEAN,“结构需要清洁”。 原因可能是几乎所有的东西,不幸的是 – 文件系统,虚拟内存pipe理器,卷pipe理器,设备驱动程序或硬件。 最初发生时应该有一个详细的控制台消息。 这些消息提供了一些重要的信息给开发人员提供了一个问题被发现的最早的点。 它在那里保护你的数据。 您可以使用xfs_repair来解决问题(在卸载文件系统的情况下)。 logging到syslog XFS错误如下所示: XFS (sdb): Metadata corruption detected at xfs_inode_buf_verify+0x6d/0xe0 [xfs], block 0x50 XFS (sdb): Unmount and run xfs_repair XFS (sdb): […]

SVN版本库数据损坏

当我们在办公室的SVN服务器被拔掉,导致数据损坏时,我们错误地迅速closures了。 更新 这个SVN服务器的最后一个提交是上个星期四。 导致数据损坏的停电事件发生在周五。 如果我理解正确,发生这种情况是因为数据没有写入导致损坏的磁盘。 如何在24小时后写完磁盘? 它可能不是如何被损坏?

间歇性的javascript下载问题

我发布这个问题在stackoverflow,然后有人build议我在这里尝试,因为它似乎可能是一个服务器问题。 我的开发xampp框没有问题后,一旦我把我的网站住在我的主机上,我得到一个间歇性的问题,我的一些HTTP请求没有正确完成。 在萤火虫networking控制台中观看时,请求以0200完成,但是文件(通常是js,有时是图像文件)在js的情况下或者不存在或者在图像的情况下不完整。 这只发生在我login到我的CMS仪表板时,通常当我使用内联编辑function。 我正在使用FuelCMS。 在这种情况下,页面总共发出51个HTTP请求,总共为1.7MB。 作为腐败来的文件似乎总是“口吃”,并采取> 5s下载。 (这可能与HTTP响应中的保持活动设置有关,该响应具有5秒的超时?)然而,当没有文件超过5s时,很less发生,而且当文件有采取> 5s。 所以不知道这是否可以算作一种模式。 它发生在每十个页面加载中大约1-2个。 没有任何文件损坏的模式,或者它们是如何被破坏的。 服务器详情: Apache版本2.2.17 PHP版本5.2.17架构x86_64操作系统Linux内核版本2.6.18-194.32.1.el5 所以你去了 我很困惑! 如果任何人有任何这方面的经验,或任何可能的想法,或任何进一步的诊断我可以尝试,这将是非常感谢! 谢谢。 额外: 以下是已损坏文件的访问日志中的相关行。 看起来没有任何意义。 服务器错误日志中没有任何内容。 XX.XXX.XXX.XX – [15 / Sep / 2011:11:49:12 +0100]“GET /fuel/modules/fuel/assets/js/editors/ckeditor/ckeditor.js?c=943948800 HTTP / 1.1“200 335469” – “”Mozilla / 5.0(Windows NT 6.1; WOW64; rv:6.0.2)Gecko / 20100101 Firefox / 6.0.2“

如何发送损坏的netbios数据包

我想发送一个损坏的NetBIOS会话服务数据包到我的机器,我的目标是检查我的机器是否重新启动或接收到损坏的NetBIOS数据包(以前发生过,我想重现相同)。 我正在使用scapy这是一个python工具build立一个连接到139端口的机器,然后我发送一个NBTSession()数据包到机器。 在wireshark跟踪中,我看到会话已build立,但是当我尝试使用NBTSession()层发送数据包时,wireshark跟踪显示了它的NBSS延续消息 。 from scapy.all import * def nbt_func(): nb=NBTSession(TYPE=0x81,RESERVED=10,LENGTH=2000) rnb=Raw(nb) s=socket.socket() s.connect(("10.62.147.30",139)) ss=StreamSocket(s,Raw) s.sr1(rnb) if __name__ == "__main__": nbt_func() 不知道为什么会发生这种情况,还是有其他方法可以复制这个问题? 我在NBTSession()字段中给出了一些随机值,因为我认为给出错误的值意味着破坏了数据包。 谢谢您的帮助。

在SAN连接的LUN上运行带有NTFS损坏的SpinRite

得到一个客户有一个NTFS损坏的问题,popup在SAN连接存储。 LUN是RAID-10(4:1主轴比)。 这些机器是Windows Server 2003(64位),他们正在计划迁移到Windows 2008 R2(64位)。 SAN的制造(谁将不知名)将不知所措(或为什么发生),微软支持已经说要进行备份。 (不是一件容易的事情,备份方法是BLOCK-LEVEL,而不是FILE-LEVEL。驱动器上的任何损坏都被复制到备份中)。 我知道这是一个很长的一步,但是在LUN上运行SpinRite会值得吗?

如何在损坏的安装后重buildVMhost数据存储

我的服务器在周末关机,计划停电给我们的build筑物。 当我尝试恢复服务器时,还有一些关于不存在的逻辑驱动器的错误(现在已经sorting),我发现自己的SD卡中包含了ESXi 4的安装。 我已经更换了SD卡,并重新安装了ESXi 4。 目前我正在运行30天试用模式,因为目前我无法访问我们的许可证信息。 我需要能够恢复最初在逻辑驱动器上的数据存储。 我查看了存储适配器,这些似乎与我拥有的另一台服务器类似,但是没有列出任何WWN详细信息。 然后我点击了Storage | 添加存储| 磁盘选项 我在这里没有任何可用的东西。 我如何获取数据? 提前谢谢了。

英特尔CPU上的高速caching中的随机位错误会发生什么情况?

我有一个ECC RAM和Xeon E3 CPU的系统。 我的理解是,RAM上的ECC电路将检测RAM芯片中随机位错误的损坏。 但是,存储在英特尔CPU中的内存中的随机位错误会发生什么? 例如caching和/或寄存器? 是否没有一个覆盖漏洞将好的RAMcaching到CPU中,这个caching的RAM然后被破坏,然后由CPU使用(没有检查ECC RAM)? 我在英特尔网站上找不到任何有关高速cachingECC保护的信息。 这是否意味着至lessE7系列以下的任何英特尔CPU无论是否使用ECC内存都容易受到内存损坏?

整个Ubuntu服务器的数据传输不一致导致系统不稳定和数据损坏

更新2 我们更换了CPU,一切都很好。 这是一个破产的CPU! 更新 我们更换了主板,并且仍然得到完全相同的问题。 这是否意味着它是一个错误的CPU? 还有什么呢? 在运行Ubuntu 14.04 LTS的服务器上,我们一直在努力解决数据损坏问题。 这个问题首先performance为一个不稳定的Minecraft服务器,它会由于关卡文件中的数据损坏而崩溃。 我们很快就发现,由于networking连接变得不可靠,SSH系统常常因为接收到各种不好的数据包而断开连接(例如,“input损坏的MAC”),并发现下载到服务器的大文件将返回不一致的哈希(通过md5sum和sha1sum )指示传输过程中的损坏。 有时,不止一次地使用哈希文件甚至不会返回一致的哈希,虽然这似乎是当问题由更高的负载加剧。 此外,服务器收到来自本身的电子邮件,指出随机程序崩溃。 例如,一些电子邮件是关于cacti轮询器,这是一个PHP脚本,崩溃的消息“Segmentation fault(core dumped)”。 所有这些似乎都指向了一个硬件问题(例如坏的RAM),但是在memtest86 +出现以后(至less2遍以上),我们尝试从一个活的USB(Xubuntu 12.04)进行引导,并且没有发现下载大文件的问题。 所以这是一个软件问题,除非这是一个疯狂的巧合。 它看起来不是内核相关的,因为在启动菜单上select的前一个内核上仍然出现错误。 最近在轻负载下的testing显示networking传输被损坏,但驱动器之间(以及通过USB)和虚拟硬盘on / tmp之间的本地传输没有损坏。 但是我们确信java / Minecraft的问题是相关的,因为同一时间发生的事实,以前的工作设置的Minecraft服务器,我们恢复崩溃类似于新的。 感谢您的帮助,我们欣赏这些信息是模糊的,但是我们正处于智慧的终点。 编辑: 我在networking上尝试了一些已知的良好来源的不同副本。 其中一份不是腐败的。 所有其他人都是腐败的,但具体而言,如果我运行: vbindiff copied_file good_file 在文件的表面上随机部分有几个(2或3)错误。 但是每个错误都是4的增量。例如, 45会转到49 ,或者a9转到hex转储的ad 。 这似乎很奇怪。 编辑2: 我试着再次启动到一个现场的CD,并出现了错误。 所以这不是一个软件问题。 编辑3: 愚蠢的是,在我们的testing过程中,我们忘了拔下一个连接了外置硬盘的USB3卡。 该错误似乎已经固定 – 不是通过取出卡,而是通过没有插入外部驱动器。 在某个时候(可能是明天),我们会尝试将外部硬盘插入SATA端口,然后再查看错误是否再次发生。

elasticsearch glibc内存损坏

我的弹性search群无故停止崩溃。 我能在日志中看到的是: INFO | jvm 4 | 2015/04/17 19:10:09 | *** glibc detected *** /usr/java/jre1.7.0_04/bin/java: malloc(): memory corruption: 0x00007f6a2c4d8560 *** 我有一个主人和两个奴隶的集群。 我有一个旧版本(“0.20.2”),但从来没有一个问题,目前为止…我不能更新容易,只会认为这是最后的手段。 我不知道从哪里开始, 到目前为止,我已经改变了以下设置: wrapper.java.additional.3=-Xss256k到wrapper.java.additional.3=-Xss512k 并删除了所有的指标(这需要一些清洁) 不幸的是,即使没有任何索引,问题仍然存在。 java is java version "1.7.0_04" Java(TM) SE Runtime Environment (build 1.7.0_04-b20) Java HotSpot(TM) 64-Bit Server VM (build 23.0-b21, mixed mode) 包装设置更改之前,我也越来越 INFO | jvm 1 | 2015/04/17 16:03:05 […]