모니터링 설치 강의 따라하는 중에 이상한 현상이 있습니다 .
239
작성한 질문수 4
안녕하세요.
모니터링 설치 Loki-Stack 강의 실습을 하는 와중에
2번 확인하기를 해보니 캡쳐와 같이 pod가 엄청 많이 떠있는 걸 확인했습니다. 그래서 그런지 대시보스 화면에서는
여러가지 에러 상태가 나타납니다. 거의 메모리가 부족하다고 하는 데 현재 해당 vm 에는 메모리를 8gb 주고 free 로 확인해보면 여유가 2gb 이상 남아있는 걸로 확인이 되고요.

이유를 아실까요 ? 그리고 어떻게 해결할 수 있을까요 ?
감사합니다.

cafe: https://cafe.naver.com/kubeops
답변 2
1
일단 Pod가 비정상적으로 종료되었으나, Kubernetes가 이를 인식하지 못할 경우 ContainerStatusUnknown 상태가 유지될 수 있습니다 현재 그런 Pod들이 많이 생겼네요.
뭔가 클러스터 상태가 정상적이지 않은 것 같고요. 그렇기 때문에 memory 에러도 발생을 한 걸로 보입니다. 실제 VM의 memory가 모자란 게 아니라, 비 정상적인 Pod들로 인해 쿠버네티스가 관리하는 Request Memory를 모두 차지하고 있어서, 더 이상 할당할 수 없다는 에러고요.
한번 VM을 재기동 하거나, 아니면 kubectl delete -n <namespace> pod <pod-name> --force로 비정상 상태인 Pod들을 모두 제거해보세요.
근데 현재 클러스터 상태에 이상이 있는 것 같고 트러블슈팅을 해봐야 하는데, 초기 세팅시에 이런 문제가 발생하는 게 흔한 것도 아니기 때문에, 원인을 찾기보단 재설치를 해보는 걸 먼저 권해드립니다.
그리고 재설치 후 전체 Pod 상태 이상유무를 먼저 확인해보시겠어요?
0
안녕하세요, 인프런 AI 인턴입니다.
끝없는초보님, Loki-Stack 모니터링을 설치한 후 Pod가 너무 많이 뜨고 대시보드에서 다양한 에러 상태를 마주하고 계신 것 같습니다. 특히 메모리 부족과 관련한 에러 메시지가 주요 원인으로 생각됩니다. 유사한 문제를 겪었던 다른 학생들의 질문 및 답변을 참고하면 도움이 될 것입니다.
Pod 과다 생성 문제 및 대시보드 에러
Pod가 너무 많이 생성되는 문제는 다음과 같은 원인일 수 있습니다:
리소스 할당: 특정 Pod에 너무 많은 리소스를 할당하거나, 각기 다른 구성 요소가 리소스를 많이 요구할 때 나타나는 현상입니다. Pod의
values.yaml파일을 검토하여 메모리와 CPU 할당을 재조정해 보세요.메모리 부족 문제: 메모리가 충분히 남아있다고 생각되더라도, 특정 Pod가 요구하는 메모리를 충족하지 못할 수 있습니다.
kubectl describe pod <pod-name>명령어를 통해 상세한 에러 로그를 확인하여 어떤 Pod가 문제를 일으키는지 확인하세요.Pod 로그 확인:
kubectl logs <pod-name>명령어로 Pod의 로그를 확인하여 어떤 에러가 발생하고 있는지 정확히 파악해 보세요.
유사한 문제 및 해결 사례
아래에서 다른 학생들이 유사한 문제를 어떻게 해결했는지 확인할 수 있습니다:
프로메테우스 로그에 no data: Prometheus 및 Loki-stack 설치 후 Grafana에서 데이터가 표시되지 않는 문제를 해결한 사례입니다. 데이터 소스 설정 및 네트워크 연결 문제를 점검하는 방법을 설명하고 있습니다.
Logging - 실습 진행중 loki-stack pod 생성에 문제가 있습니다.: Loki-stack Pod가 CrashLoopBackOff 상태로 재시작되는 문제를 해결한 사례입니다. 리소스 제한, 환경 변수 설정, 종속성 문제를 확인하는 절차를 다루고 있습니다.
추가 참고 자료
- Pod 상태 점검:
kubectl get pods -A명령어로 전체 Pod의 상태를 확인하고, 문제가 되는 Pod를 집중적으로 점검하세요.
- 네임스페이스 설정 확인: 각 네임스페이스의 리소스 사용 현황을 확인하세요. 특정 네임스페이스에서 과한 리소스 사용이 문제를 일으킬 수 있습니다.
위의 정보를 참고하여 문제를 해결해 보시고, 더 궁금한 사항이 있다면 이어서 질문해 주세요. 곧 지식공유자께서도 도움을 주실 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
젠킨스버전과 플러그인설치
1
35
2
강의자료 원본 애니메이션처리가 되어 있을까요?
1
87
1
get pods 했을 때 connection refused가 뜹니다.
1
92
3
베이그란트 플러그인 설치 실패
1
86
1
실습겸 미니pc사보려는데 이정도면 괜찮을까요?
0
95
2
Image updater 1.0 이후 CRD 기반 변경 시 적용 방법 공유합니다.
1
85
1
기본 values 파일과 service name에 대한 질문이 있습니다.
0
73
2
Sprint 2 강의에서 yaml 파일들 경로에 대해 궁금한게 있어요.
1
64
2
Selector의 속성에 대해 질문 드립니다.
1
60
1
인스턴스 스펙
1
70
2
Container 기술 관련해서 질문드립니다.
1
84
3
Jenkins 빌드 UI 설정 관련 질문드립니다.
1
86
3
Jenkins 빌드 진행 UI 설정
0
70
1
cicd 서버 올린 후 기존 마스터 노드 기동 시 네트워크 에러
1
80
2
HPA - Auto Scaling 실습 관련 에러 해결 공유.
1
66
1
Loki-Stack 실습 관련 질문
1
74
2
Self-Healing 테스트 중 문의사항
1
73
2
영상 내용과 강의 자료가 상이해서 강의 듣기가 짜증납니다.
0
108
2
젠킨스 구축 9단계 오류
1
89
3
실습환경 네트워크 끊김 및 느린 속도 관련 질문
1
86
2
온프레미스 환경에 쿠버네티스도입
1
102
1
SealedSecret 관련 궁금증.
1
53
1
vagrant up 사용 시 The SSH connection was unexpectedly closed by the remote end
1
90
2
젠킨스 배포 질문
1
60
2





