inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

쿠버네티스 어나더 클래스-Sprint 1, 2 (#실무기초 #설치 #배포 #Jenkins #Helm #ArgoCD)

📝 모니터링 설치 - Loki-Stack (💻 실습포함)

모니터링 설치 강의 따라하는 중에 이상한 현상이 있습니다 .

239

끝없는초보

작성한 질문수 4

1

안녕하세요.

모니터링 설치 Loki-Stack 강의 실습을 하는 와중에

2번 확인하기를 해보니 캡쳐와 같이 pod가 엄청 많이 떠있는 걸 확인했습니다. 그래서 그런지 대시보스 화면에서는

여러가지 에러 상태가 나타납니다. 거의 메모리가 부족하다고 하는 데 현재 해당 vm 에는 메모리를 8gb 주고 free 로 확인해보면 여유가 2gb 이상 남아있는 걸로 확인이 되고요.

Screenshot 2024-09-30 at 13.06.12.png

 

이유를 아실까요 ? 그리고 어떻게 해결할 수 있을까요 ?

감사합니다.

Screenshot 2024-09-30 at 13.01.36.png

 

cafe: https://cafe.naver.com/kubeops

kubernetes infrastructure container

답변 2

1

일프로

일단 Pod가 비정상적으로 종료되었으나, Kubernetes가 이를 인식하지 못할 경우 ContainerStatusUnknown 상태가 유지될 수 있습니다 현재 그런 Pod들이 많이 생겼네요.

뭔가 클러스터 상태가 정상적이지 않은 것 같고요. 그렇기 때문에 memory 에러도 발생을 한 걸로 보입니다. 실제 VM의 memory가 모자란 게 아니라, 비 정상적인 Pod들로 인해 쿠버네티스가 관리하는 Request Memory를 모두 차지하고 있어서, 더 이상 할당할 수 없다는 에러고요.

한번 VM을 재기동 하거나, 아니면 kubectl delete -n <namespace> pod <pod-name> --force로 비정상 상태인 Pod들을 모두 제거해보세요.

근데 현재 클러스터 상태에 이상이 있는 것 같고 트러블슈팅을 해봐야 하는데, 초기 세팅시에 이런 문제가 발생하는 게 흔한 것도 아니기 때문에, 원인을 찾기보단 재설치를 해보는 걸 먼저 권해드립니다.

그리고 재설치 후 전체 Pod 상태 이상유무를 먼저 확인해보시겠어요?

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

끝없는초보님, Loki-Stack 모니터링을 설치한 후 Pod가 너무 많이 뜨고 대시보드에서 다양한 에러 상태를 마주하고 계신 것 같습니다. 특히 메모리 부족과 관련한 에러 메시지가 주요 원인으로 생각됩니다. 유사한 문제를 겪었던 다른 학생들의 질문 및 답변을 참고하면 도움이 될 것입니다.

Pod 과다 생성 문제 및 대시보드 에러

Pod가 너무 많이 생성되는 문제는 다음과 같은 원인일 수 있습니다:

  1. 리소스 할당: 특정 Pod에 너무 많은 리소스를 할당하거나, 각기 다른 구성 요소가 리소스를 많이 요구할 때 나타나는 현상입니다. Pod의 values.yaml 파일을 검토하여 메모리와 CPU 할당을 재조정해 보세요.

  2. 메모리 부족 문제: 메모리가 충분히 남아있다고 생각되더라도, 특정 Pod가 요구하는 메모리를 충족하지 못할 수 있습니다. kubectl describe pod <pod-name> 명령어를 통해 상세한 에러 로그를 확인하여 어떤 Pod가 문제를 일으키는지 확인하세요.

  3. Pod 로그 확인: kubectl logs <pod-name> 명령어로 Pod의 로그를 확인하여 어떤 에러가 발생하고 있는지 정확히 파악해 보세요.

유사한 문제 및 해결 사례

아래에서 다른 학생들이 유사한 문제를 어떻게 해결했는지 확인할 수 있습니다:

추가 참고 자료

  1. Pod 상태 점검: kubectl get pods -A 명령어로 전체 Pod의 상태를 확인하고, 문제가 되는 Pod를 집중적으로 점검하세요.
  2. 네임스페이스 설정 확인: 각 네임스페이스의 리소스 사용 현황을 확인하세요. 특정 네임스페이스에서 과한 리소스 사용이 문제를 일으킬 수 있습니다.

위의 정보를 참고하여 문제를 해결해 보시고, 더 궁금한 사항이 있다면 이어서 질문해 주세요. 곧 지식공유자께서도 도움을 주실 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

젠킨스버전과 플러그인설치

1

35

2

강의자료 원본 애니메이션처리가 되어 있을까요?

1

87

1

get pods 했을 때 connection refused가 뜹니다.

1

92

3

베이그란트 플러그인 설치 실패

1

86

1

실습겸 미니pc사보려는데 이정도면 괜찮을까요?

0

95

2

Image updater 1.0 이후 CRD 기반 변경 시 적용 방법 공유합니다.

1

85

1

기본 values 파일과 service name에 대한 질문이 있습니다.

0

73

2

Sprint 2 강의에서 yaml 파일들 경로에 대해 궁금한게 있어요.

1

64

2

Selector의 속성에 대해 질문 드립니다.

1

60

1

인스턴스 스펙

1

70

2

Container 기술 관련해서 질문드립니다.

1

84

3

Jenkins 빌드 UI 설정 관련 질문드립니다.

1

86

3

Jenkins 빌드 진행 UI 설정

0

70

1

cicd 서버 올린 후 기존 마스터 노드 기동 시 네트워크 에러

1

80

2

HPA - Auto Scaling 실습 관련 에러 해결 공유.

1

66

1

Loki-Stack 실습 관련 질문

1

74

2

Self-Healing 테스트 중 문의사항

1

73

2

영상 내용과 강의 자료가 상이해서 강의 듣기가 짜증납니다.

0

108

2

젠킨스 구축 9단계 오류

1

89

3

실습환경 네트워크 끊김 및 느린 속도 관련 질문

1

86

2

온프레미스 환경에 쿠버네티스도입

1

102

1

SealedSecret 관련 궁금증.

1

53

1

vagrant up 사용 시 The SSH connection was unexpectedly closed by the remote end

1

90

2

젠킨스 배포 질문

1

60

2