金年会jinnian

    服务器 2024-11-15

    KunTai R2260服务器宕机问题分析

    一、 现网描述

    1.1 环境描述

    设备型号:KunTai R2260

    硬件配置:3508 RAID卡


    二、故障描述

    2.1 故障现象

    客户现场2022-03-24业务运行过程中,一台服务器出现宕机的问题。

     

    三、 问题分析

    3.1 排查思路

    1、 Sel日志中记录2022-3-24显示RAID卡与BMC通信丢失

    image.png 

    2、 maintenance_log记录 raid卡心跳异常

    image.png 

    3、 RAID_Controller_Info中查看,RAID卡显示状态异常,且RAID组、硬盘状态异常

    image.png 

    判断为RAID卡故障,建议更换RAID卡

    3.2 原因分析

    RAID卡故障


    四、问题解决

    4.1 解决办法

    建议更换RAID卡

    4.2 分析总结

    raid卡故障,导致raid卡信息、硬盘信息获取不到,raid配置找不到,进不去系统,并产生raid卡与iBMC通信丢失告警。

    更换raid卡问题解决,服务器当前运行状态无异常。