ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Supermicro server ipmitool 로 하드웨어 오류 체크하는 방법
    IT Operation 2022. 9. 6. 20:18
    반응형

    슈퍼 마이크로 서버에서 Out of memory 오류가 거의 하루에 한 번씩 나타나서 점검을 요청했다. 

    엔지니어는 서버 내에 내장되어 있는 ipmitool을 이용하여 로그를 보내줄 수 있냐는 답변을 보내왔다. 

    문제의 Out of memory 오류

     

     

     

     

     

     

     

     

     

    ipmitool이 무엇인지 궁금하여 엔지니어에게 물어보았다.

    이 툴을 이용하여 BMC에서 수집하는 하드웨어 이벤트 로그를 확인할 수 있다고 하였다.

    Out of memory가 자주 생기는건 하드웨어 상에 꽂힌 램에 문제가 있는지 보려고 한 것이다.

    명령어는 아래와 같다.

    sudo ipmitool sel list

    결괏값이 아래와 같이 나왔고 엔지니어에게 전달했다.

    ipmitool을 이용한 명령어 실행 결과

     

     

     

     

     

     

     

     

     

     

     

     

     

    엔지니어의 의견은 하드웨어 적으로는 이슈 사항이 없는 것으로 보아 램의 불량이거나 고장은 아닌 것으로 보인다고 하였다.

    아마도 순간적인 메모리 사용량이 급격하게 증가하여 커널 패닉 증상이 나타난 것이 아니냐는 추측을 하였다.

    하지만 해당 항목이 의미하는 바를 정확히 알수 없었고 검색해서 찾아봐야 할거 같다.

     

    반응형

    댓글

Designed by Tistory.