7.5강 livenessProbe exec 방식에 관한 질문입니다

Question

livenessProbe는 실행 중 애플리케이션에 문제가 발생하면 애플리케이션이 재기동되는 탐사라고 하셨습니다.

탐사 체크 조건을 exec 방식으로 cat /tmp/healthy-on 하도록 했을 때, periodSeconds를 10초 간격으로 주면 아직 애플리케이션 실행이 완료되지 않아 탐사에 실패하여 Unhealthy상태 -> killing상태 -> 앱의 재기동이 반복되는 프로세스는 이해를 했습니다.

그런데 periodSeconds 를 30초 간격으로 주었을 때에도 cat /tmp/healthy-on 을 하지 못해 Unhealthy가 떴는데요(livenessProbe failed 됨).

그럼 애플리케이션이 재기동되어야 하는 게 아닌가요? 탐사에 실패했는데도 unhealthy 상태를 그대로 유지하는 까닭이 무엇인가요?

그리고 아래 분의 질문에 덧붙여 한 가지 더 질문드리고 싶습니다.

livenessProbe일 경우, initialDelaySeconds가 10초이고, periodSeconds가 30초이면, 첫 탐사 체크는 파드 running 후 40초(10초+30초)쯤 이루어진다고 보면 되나요?

아직 이해가 부족한 듯하여 부끄럽네요..

답변 미리 감사드립니다.

Answer

자세한 설명 감사합니다. 당시 진행했던 데이터는 다음과 같습니다.아래가 말씀드린 실습 부분인데, 헬스 체크했을 때 unhealthy가 2번 발생했고 killing은 발생하지 않은 모습입니다.[root@m-k8s ~]# k apply -f _Lecture_k8s_learning.kit/ch7/7.5/livenessProbe-exec-periodSeconds30.yaml pod/liveness-exec created  [root@m-k8s ~]# watch 'kubectl describe po liveness-exec | tail' Every 2.0s: kubectl describe po liveness-exec | tail                                                                                                  Fri Mar 10 09:05:49 2023                               node.kubernetes.io/unreachable:NoExecute op=Exists for 300s Events:   Type     Reason     Age                 From               Message   ----     ------     ----                ----               -------   Normal   Scheduled  2m21s               default-scheduler  Successfully assigned default/liveness-exec to w2-k8s   Normal   Pulling    2m17s               kubelet            Pulling image 'sysnet4admin/tardy-nginx'   Normal   Pulled     2m15s               kubelet            Successfully pulled image 'sysnet4admin/tardy-nginx' in 2.442951756s   Normal   Created    2m14s               kubelet            Created container tardy-nginx   Normal   Started    2m14s               kubelet            Started container tardy-nginx   Warning  Unhealthy  81s (x2 over 111s)  kubelet            Liveness probe failed: cat: /tmp/healthy-on: No such file or directory

Answer

안녕하세요 1.Unhealty 부분 해당 부분에 애플리케이션은 계속 다시 시작한게 맞습니다. 예를 들면 다음과 같이 pid 1번을 강제로 죽이면 restart 합니다. [사진]영상을 다시 보시고, 3가지의 개념에 대해서 다시 이해해 보시면 아마 현재 상황이 이해되시리라고 생각됩니다. 2.livenessProbe timing 애플리케이션이 정상적으로 Running하는지 체크하는것이기 때문에 Running한 후에 동작하는게 아닙니다. 따라서 질문 주신 것은 아마 약간 오해가 있으셨던거 같은데... 애플리케이션의 동작 그리고 서비스(엔드포인트 생성)과 연관지어 각각의 Probe를 이해하시면 좋으실 것 같습니다. 또는 괜찮으시다면 영상을 1-2회 정도 더 보시면서 관련 문서를 보시는 것도 좋을 것 같습니다. 경우에 따라서는 다양한 방법과 설명을 통해서 이해되고 습득 되는 경우가 있어서요.

mihyeondev

7.5강 livenessProbe exec 방식에 관한 질문입니다

이 글과 비슷한 Q&A

worker node 이미지가 한개 부족합니다

Jenkins Pipeline step 1 에러입니다.

helm으로 프로메테우스 설치 시 PVC 관련 질문

자바 스프링 개발자입니다.