Articles of ecc

Amazon SES for ubuntu中的sendmail

我试图使用Amazon SES sendmail在我的Ubuntu服务器发送邮件,因为EC2 ips被列入黑名单,我遵循以下教程 http://docs.amazonwebservices.com/ses/latest/DeveloperGuide/index.html?InitialSetup.EmailVerification.html 但它不工作不知道为什么请帮助我

重新获得对EC2 EBS引导映像的根访问权限

我正在使用禁用根SSHlogin的Alestic镜像,但是提供了一个具有NOPASSWD sudo权限的用户“ubuntu”。 看到这里 。 在尝试向sudoers文件添加新用户的过程中,我无意中为“ubuntu”用户创build了另一行,这次没有 NOPASSWD。 我现在显然已经失去了对本机的root权限。 有没有办法在不同的实例上安装EBS根卷(修复sudoers文件),然后重新启动服务器? 还是我完全搞砸了?

ZFS带非ECC RAM的替代文件系统/卷pipe理器?

不build议在没有ECC RAM的计算机上使用ZFS。 那么,什么是一个好的select呢? 或者风险是一样的,所以使用什么pipe理器并不重要,如果RAM中的某个内容翻转,也会出现同样的问题? 我试图确定是否应该或不应该使用ZFS。 如果我不这样做,有没有什么比非ECC内存更安全?

ECC内存错误计数器在哪里存储?

ECC内存错误计数器在哪里存储:在DIMM本身,主板或主机的磁盘上? 我正在使用memtest86 +,但它似乎无法识别我的系统上的ECC,所以如果发生可纠正的错误,memtest86 +就不会看到它们。 我想知道他们是否还会在Linux /sys/devices/system/edac显示出来,如果存储错误计数是操作系统的责任,那么他们当然不/sys/devices/system/edac 。

一个服务器是否需要ECC ram启用GPU,或者一个普通的gpu在服务器上工作正常吗?

服务器是否需要在GPU上使用ECC ram,而正常的CPU ram是ECC? 我认为,而不是使用的Quadro K6000或AMD FirePro,我们可以使用GTX 980或AMD R9 290 …如果可能的话…如果不一定需要使用ECC RAM …比那里“服务器”GPU(i7处理器是“像”一个服务器E7 … E7一般为服务器/工作站,因为I7一般为桌面)…请帮助!

使用亚马逊EBS来存储您的数据库。 并增加存储空间!

好的,您可以将数据库存储在Amazon EBS上,当您想添加额外的存储空间时, 你将需要 1)拍摄一张快照,然后永远等待拍摄快照 2)从快照中创build一个新的更大的卷,并再次等待它来创build您的卷。 3)停止你的瞬间 4)分离旧的音量,然后重新连接新的音量。 5)开始你的瞬间 没有停机时间,没有更简单快捷的方法吗?

L3caching中的ECC错误 – 是否严重?

在linux服务器上(8x四核AMD 8378),我收到以下错误: [Hardware Error]: MC4_STATUS[-|CE|MiscV|-|AddrV|CECC]: 0x9c294c00001d018b [Hardware Error]: Northbridge Error (node 4): ECC error in L3 cache tag. [Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: SNP [Hardware Error]: Machine check events logged 这在上个月发生了三次,但从未(服务器运行了三年)。 从一个快速的谷歌search,似乎这是一个严重的问题。 但是,供应商支持技术人员说: 我已经看到了这些错误很多次,除非你超频你的CPU – 或者有一个风扇故障或类似的 – 这是不太可能是一个处理器的问题。 内核更可能错误地报告错误。 所以 – 这是一个严重的错误,我应该订购新的部件(取代CPU?)或忽略它? 非常感谢。

评估不可纠正的ECC错误和回退方法

我运行一个服务器,刚刚遇到一个我以前没有遇到的错误。 它发出几声嘟嘟声,重新启动,并卡在启动屏幕(bios显示其标志的部分,并开始列出信息)与错误: Node0:DRAM不可纠正的ECC错误 节点1:HT链接同步错误 硬重置后,系统启动良好,尚未报告任何edac-util。 我的研究告诉我,即使在ECC存储器和理想情况下的系统中,一个不可纠正的错误仍然是可能的,并且很可能在系统的某个使用寿命期间发生。 一些报道至less每年一次或更早提出。 服务器运行CentOS 6.5和几个ECC模块。 我已经在试图诊断哪个模块抛出错误来评估这是一个错误,还是像宇宙射线这样的不可避免的事情的结果。 我的研究还表明,当系统暂停时,无法写入日志,唯一可靠的方法是将系统连接到另一个日志,通过串行端口写入日志。 除了通常的edac-util,memtest,压力testing和预防replace,在处理这个错误时还有什么我应该考虑的? 在我search的任何CentOS日志中,我无法find这个崩溃的logging,这与我相信不能将这个错误logging到本地磁盘一致。 这个错误只有在自动重新启动之后由bios报告给我。 是否build议将系统日志写入串行以logging这些types的错误? 使用单个系统可以避免这种故障吗?或者只有使用昂贵的企业解决scheme才能实现这种故障? 我能做些什么来为单个生产服务器的这些故障情况提供后备措施; 如在,生产服务器本身不跨越多台机器,但后备服务器可以存在。

在RAID控制器上检测到“单比特ECC错误”是什么意思?

我有戴尔T7600与Perc H710P RAID控制器和4个附加的3TB驱动器。 在过去几个月中,RAID控制器在引导时间间歇性地报告错误:“找不到引导设备”,“在baseport处的适配器没有响应”,磁盘经常报告为缺失或失败。 我已经取代了RAID控制器,4个硬盘,最后是系统的主板。 更换主板并重新启动几次后,我得到了错误 Single bit ECC errors were detected on the RAID controller. Please contact technical support to resolve this issue. 重新启动约20次后,我还没有看到ECC错误。 系统看起来不错,除了磁盘风扇有时会在系统处于完全空闲状态时开始全面爆炸,而且不会停止,直到我重新启动。 RAID控制器上的内存中的ECC错误是否存在? 或者,RAID控制器是否映射到系统内存中,ECC错误是否真的在系统内存中? 或者,驻留在RAID控制器中的1GB高速caching中的ECC错误?

在Amazon EC2服务器上接收电子邮件

我刚刚开始使用EC2实例,并取消了我的邮件发送限制,允许我从实例发送邮件。 但由于缺乏经验,我不知道如何启用在该服务器上发送给我的接收电子邮件。 该实例有一个弹性的IP,我有一个域名的Alogging指向该IP。 我似乎无法find更好的文档,说明需要采取什么措施,所以如果有人向[email protected]发送电子邮件,它实际上会收到邮件,或者只是将邮件转发给我的个人电子邮件。 我知道它涉及到使用后缀,但找不到安装后正确configuration它的指南。