查看: 9|回复: 0

[运维] Info:Memory module [DIMM] needs attention: Single-bit warning error rate exceeded, Single-bit failure error rate exceeded

[复制链接]

2

主题

0

回帖

0

积分

热心网友

金币
0
阅读权限
220
精华
0
威望
0
贡献
0
在线时间
0 小时
注册时间
2010-3-30
发表于 2023-8-20 00:00:00 | 显示全部楼层 |阅读模式

dell服务器硬件监控软件openmanager,可以对电池,主板,温度,以及硬盘等等进行监测。安装使用可以参见《Dell服务器安装OpenManage(OMSA)》

在监测中,可能会遇到下面的错误信息:

Info:Memory module 6 [DIMM7, 2048 MB] needs attention: Single-bit warning error rate exceeded, Single-bit failure error rate exceeded

这说明内存监测有问题了,可能内存松动等等,但是系统还是可以认到该条内存的。需要关机重新拔插下该条内存的。由于需要停服关机,会影响业务的。但是该问题会一直报警的。收到报警信息大家都会觉得烦躁的。可以对内存的监控屏蔽掉,方法如下:

check_openmanage --check storage -b dimm=all

可以看到内存和Voltage没有检测。

不加dimm=all就会检测内存的。

可以对相关硬件检测进行屏蔽掉。如温度检测等等。如:

/usr/local/nagios/libexec/check_openmanage --check storage -b ctrl_fw=all/ctrl_driver=all/ctrl_stdr=all/bat_charge=all/encl=all/ps=all/fan=all/temp=all/volt=all
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

在本版发帖返回顶部