인프런 커뮤니티 질문&답변

kbm6609님의 프로필 이미지
kbm6609

작성한 질문수

스프링 부트 - 핵심 원리와 활용

모니터링

작성

·

573

1

좋은 강의 올려주셔서 정말 감사합니다.

 

spring boot, jvm을 모니터링하고 있는데 system cpu, proess cpu 같은 치수들을

보면서 무엇이 위험한 수치이고 어떻게 대응해야 하는 지 감이 오지 않아서

제 나름대로 공식 문서나 구글링을 찾아보곤 하는데 혹시 어떤 문서를 읽는 것이 좋은 가요?

 

예를 들면 cpu 사용량이 0.006정도 되는데 얼마의 치수가 되면 위험하고 대응해야 하는 지 궁금합니다...

 

읽어주셔서 정말 감사합니다.

답변 1

1

안녕하세요, kbm6009 님. 공식 서포터즈 y2gcoder 입니다.

장애 감지 기준에 대한 질문이네요.

어떤 상황이 장애 인지 아닌지 판단하기 위한 기준은 과거의 기록, 즉 패턴입니다. 이런 경험에 기반하여 판단할 수 밖에 없습니다.

물론 어플리케이션을 틀면 메모리 점유율이 지속적으로 증가한다거나 하는 명백한 문제가 발생하면 전체적인 메모리 누수를 찾는 등의 조치를 취해야 합니다. 그러나 일반적으로 특정 시간대에 CPU/메모리 사용량이 어느정도를 유지한다 라는 기록이 있다면, 이 패턴이 깨지는 순간이 장애가 발생했다고 볼 수 있습니다.

트래픽의 경우도 보통 시간대별로 일정한 양상을 보입니다. 다만 트래픽은 이벤트 등의 요인으로 일시적으로 몰리는 경우가 있습니다. 그래서 장애여부를 판단하기 위해선 종합적인 데이터나 비지니스 상황을 모두 고려해야 합니다.

감사합니다.

kbm6609님의 프로필 이미지
kbm6609

작성한 질문수

질문하기