강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của sundai0163
sundai0163

câu hỏi đã được viết

Học Prometheus qua thực hành (Prometheus Stack)

2.11.Cài đặt Prometheus bằng Helm trên Kubernetes đã triển khai

Mac m3, vmware fusion k8s, prometheus 설치 문제

Viết

·

179

0

질문 답변을 제공하지만, 강의 비용에는 Q&A는 포함되어 있지 않습니다.
다만 실습이 안되거나, 잘못된 내용의 경우는 알려주시면 가능한 빠르게 조치하겠습니다!

[질문 전 답변]
1. 강의에서 다룬 내용과 관련된 질문인가요? [예 | 아니요]
2. 인프런의 질문 게시판과 자주 하는 질문에 없는 내용인가요? [예 | 아니요]
3. 질문 잘하기 법을 읽어보셨나요? [예 | 아니요]
(https://www.inflearn.com/blogs/1719)
4. 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

[질문 하기]

 

안녕하세요 강사님

mac m3 사용중이고 퓨전에 vagarant up으로 설치 후 helm으로 프로메테우스를 설치한 뒤 ui에 접속해서 up으로 상태를 확인하다가 문제가 발생해서 공유드립니다. 해결 방법 알 수 있을까요?

  1. calico-node 1개가 정상적으로 안 올라옴
    Readiness probe가 실패했다고 나오네요 어떤 문제일까요?


    Readiness probe failed: calico/node is not ready: BIRD is not ready: Error querying BIRD: unable to connect to BIRDv4 socket: dial unix /var/run/calico/bird.ctl: connect: conn

    ection refused

  2. prometheus-kube-state-metric pod가 정상적으로 안올라옴 -> 인증서 유효기간이 타임존이 잘못 설정되어 생기는 문제로 보입니다. 제가 12-25일 18시 KST로 설치를 했는데,, 12-25일 18시 UTC 부터 사용이 가능해보입니다 이건 내일 다시 하면 유효기간이 맞아서 될 것 같기도 합니다.
    Failed to create pod sandbox: rpc error: code = Unknown desc = failed to setup network for sandbox "c96d9675d52942e0290ac2843c8113dfff43b53b756ce7c5cac9212d36482059

    ": plugin type="calico" failed (add): error getting ClusterInformation: Get "https://10.96.0.1:443/apis/crd.projectcalico.org/v1/clusterinformations/default": tls: failed to verify certificate: x509: certificate has expired or is not y

    et valid: current time 2024-12-25T18:37:35+09:00 is before 2024-12-25T18:10:21Z

  3. 프로메테우스 ui에서 다음과 같은 warning이 뜹니다
    Warning: Error fetching server time: Detected 32191.573999881744 seconds time difference between your browser and the server. Prometheus relies on accurate time and time drift might cause unexpected query results.

kubernetesprometheus

Câu trả lời 1

0

kubernetes님의 프로필 이미지
kubernetes
Người chia sẻ kiến thức

안녕하세요

위의 내용만으로 왜 1개의 calico-node에 문제가 발생하는지 100% 정확하게 알기는 어려운 부분이 있지만 CNI가 정상적으로 동작하지 않는 환경에서는 #2,#3 모두 발생할 수 있습니다. (시간을 맞추는 것도 결국 네트워크로 하는거라서요)

혹시 괜찮으시다면 k rollout restart -n kube-system ds calico-node 를 실행한 후에

5-10분 후에 위의 문제들이 해결되는지 여전한지 확인 부탁드려도 될까요?

 

Hình ảnh hồ sơ của sundai0163
sundai0163

câu hỏi đã được viết

Đặt câu hỏi